FavoriteLoading
0

2019 相關性關鍵是Semantic SEO, 是語義不是關鍵詞

Semantic SEO 強調的是語義不是關鍵字。了解搜尋引擎操作需要經常觀察搜尋排名結果。最近你可有發現一些搜尋排名最前的SERP 愈來愈多內容中并沒有直接提及搜尋關鍵字?這表示Google 已經可以進一步掌握語義分析,對一些常見主題查詢,無需太依賴關鍵字的出現來判斷相關性。當然,對一些長尾關鍵字,關鍵字的出現仍然起主導排名作用。

過去二十年,我們被迫遷就一個沒有語義分析能力的搜尋引擎,將原來日常用語的查詢約化為關鍵字。隨著語音搜尋Voice Search 普及和深度學習人工智能deep learning AI 的突破,幾年前搜尋引擎計算排名時已經引入語義分析。現在普及到中文內容。

Table of Contents

知識圖Knowledge Graph

要進行語義分析要先建立對世界觀的語義數據庫。語義數據庫愈大愈完整,分析能力愈大。就像初生嬰兒要先了解“媽媽”、“爸爸” 才能理解“媽媽去找爸爸” 這句話的意思。Google 在2010 年收購了Metaweb, 一家專門從事建立結構化數據庫Freebase 的公司,其中的技術和數據庫溶入了Google 知識圖Knowledge Graph (KG) 中。過去幾年知識圖數據庫的條目大幅倍增,2016 年5 月已能夠回答Google 處理的每月大約1000億次搜尋中的三分之一。

知識圖

知識圖是關于實體Entity 和實體之間的關系。當實體數據庫大幅增大語義分析才變得可能。搜尋輸入內容是搜尋用戶作出的一個提問。例如輸入“網上推廣” 可以是問:

  • 如何做網上推廣?更確切是互聯網(實體)上有那些文章(實體) 介紹網上推廣方法(實體) 。
  • 什么是網上推廣?更確切是網上推(實體) 的定義(屬性) 是什么?
  • 哪些網站關于網上推廣服務?更確切是那些公司(實體) 提供(關系) 網上推廣服務(實體) ?

Google最近一個專利文件,利用人工智能在用戶查詢同傳統搜尋結果中間介入,利用人工智能將用戶輸入轉變為不同的搜尋查詢(術語和概念),再發放到傳統搜尋引擎作查詢,利用人工智能再判斷哪一個返回來了結果為最優,什致乎整合不同的返回回結果。這種機制很可能已經應用在RankBrain中。


Word2Vec 概念

傳統相關性理論是關鍵字TF -IDF。但這種方法未能考慮詞匯與詞匯中間的關系。例如爸爸、媽媽看獨立的詞匯。詞匯(例如:爸爸和媽媽)的相關性需要能被計算,才能利用計算機進行邏輯推理。這是人工智能中利用Word2Vec就是利用作分析詞義找出詞匯相關性的新技術,是AI learning的一種。

想像每一個網頁都系有一組詞匯組成。谷歌使用是Word2Vec,為一群用來產生詞向量的相關模型,用來訓練以重新建構語言學之詞文本。訓練完成之后,Word2Vec 模型可用來映射每個詞到一個向量,可用來表示詞對詞之間的關系。詞向量的建立是可以透過輸入大量數據培訓(train) 出來。Google 提供一個以300兆詞詞文本培訓出的3佰萬詞向量的vector, 免費下載,用于編程。

就是一個向量形式表示每一個字。例如:母親、女人、男人、爸爸詞匯可以有關

母親爸爸女人男人
生育0.990.990.50.5
婚姻0.90.90.40.4
男性化0.010.990.010.99
女性化0.990.010.990.01
年紀0.60.60.40.4

女人和母親向量差異(Vector difference) 在“生育” 和“婚姻”。男人和父親向量差異在“生育” 和“婚姻”。因此:

母親– 女人+ 男人= 父親

更多請參閱:The amazing power of word vectors .


專題權威Topical Authority

傳統搜尋引擎解答以上問題的做法是依賴關鍵字匹配Keyword Matching。多年前搜尋引擎公司已經知道關鍵字匹配有很多盲點。最好方法是了解輸入查詢所指向的實體,實體屬性attribute 和實體與實體之間的關系relationship。再加上了解用戶搜尋意圖Search Intention 找出最適合的答案。

例如:以搜尋輸入“網上推廣公司” 為例。以前是以內容中出現“網上推廣公司” 這個關鍵字。現在通過語義分析,現在可以找出兩個實體,一個是“網上推廣”,一個是“公司”,并理解為:

“公司” → “提供服務” → “網上推廣”

而滿足為“公司” 實體的又會包含實體屬性如:”聯絡地址”、”聯絡電話”、”網站”、”提供服務”。所以SERP 根本無需包含“公司” 詞匯。”公司網站” 也是“公司” 的其中一個屬性。只要搜尋結果所列出的網站在一“公司” 實體之下可以。

從以上推斷:什么樣的網頁能在查詢“網上推廣公司” 取得高排名?搜尋引擎評估“公司” 實體會喜歡:

  • 屬于公司網站的網頁優于公司的獨立網志、優于公司的Facebook 粉絲專頁。
  • 網公司站中包含大多數公司屬性、如“聯絡電話”、”聯絡地址”、”代表人物” 等等。
  • 網公司站提到所提供服務,如: “網上推廣”。網站內愈多網頁提及此服務表示該服務對該公司愈重要(Weight Factor)。換句話說,網站具有專題權威。
  • Google My Business 很可能被搜尋引擎用于判斷公司的屬性。

從Google?專利文件可以看到評估實體一些準則。除相關性Relevance外,包括知名度Notability (又是關于反向結連),Contribution評分, Price獎項等。

但是兩個網站同樣擁有公司屬性,同樣提供網上推廣服務,Google 要判斷那一個更好?需要考慮搜尋引擎如何評估 “網上推廣” 實體?網上推廣的屬性(或相關服務) 可以是“Facebook 推廣”,”SEO”, “SEM”, “Adwords 廣告”, “YouTube 推廣”,”百度SEO” , Yahoo, Bing 等等。當網頁的其他評分相等,就需要單從內容判斷高下。所以愈多屬性出現,相關性愈高。這是共被引用Co-citation 概念。


短句,不復雜結構

搜尋引擎優化不喜歡單薄內容shallow content。從語義分析角度來看,網頁中能夠被理解的句子就是內容,不能被理解的就可能只能視為雜訊noise。一個網頁中雜訊越多,就越接近被評定為單薄的內容。網頁中具有相同含義但不同類型的措辭將被視為重復內容?duplicated content。語義分析了解短句系比較了解長句和復雜句子容易,所以短句被評定分析為什雜訊機會是較低。最簡單的結論就是語義分析時候短句簡單句法更適合搜尋引擎優化。另一個角度語音搜尋SERP統計結果亦確認語音搜尋所提供的答案都是來自較短較簡單和直接內容。


長尾關鍵字排名

長尾關鍵字由于實體并未建立或者不能輕易識別實體之間的關系,所以長尾關鍵字的出現仍然起主導排名作用。通過保留強化語義來排名,成功自然可以為多個關鍵字獲得良好排名。更多關于我們提供的SEO免費課程

尼尼網上賺錢博客,互聯網引流,網絡賺錢。博客地址:www.kebspd.live,掃描下面二維碼添加微信:網上賺錢項目和經驗分享,全自動腳本引流課程
網絡兼職賺錢