Google發布新算法研究
2018-05-14 19:39
Google Research近發表了一篇研究性論文,這篇論文詳細介紹了一種新的搜索結果排序算法。
如果將來這一算法開始實施,將會對傳統排名決定因素的影響造成很大改變。短期內,這項研究讓我們進一步了解了谷歌所提的提高內容相關性的算法更新。
SEO熱線:183-6710-6210
如果將來這一算法開始實施,將會對傳統排名決定因素的影響造成很大改變。短期內,這項研究讓我們進一步了解了谷歌所提的提高內容相關性的算法更新。
SEO熱線:183-6710-6210
新算法簡介
Google Research在第六屆國際學術會議上以通過Twitter發布了這一新算法研究論文。
論文題目是:正確提出問題:強化學習 重塑問題【Ask The Right Questions: Active Question Reformulation with Reinforcement Learning】
這篇論文討論了一種將查詢問題重塑后再提交給搜索引擎的方法。Google其實已經在實施了查詢問題的重塑和提煉,這是方法中的一種。
這一算法的創新在于這是一強化學習的機器學習算法,而且這一算法并不了解排名系統如何工作。他是通過一個黑盒子提出問題并學習。這一算法通過一個學習系統重塑用戶查詢,向搜索引擎提出諸多相關問題,然后在諸多答案中選擇合適的答案。
該算法如何工作
如下是該研究論文的一個截圖,它總結了這個機器學習算法的工作原理:
用戶提出問題,然后該機器學習算法(也就是圖中所示:Agent)將這一問題重新表述為多個問題并提交給排序算法。排序算法給出結果集,機器學習算法在眾多結果中選擇佳答案呈現給用戶。
該研究論文指出:面對復雜的信息需求,人類通過重塑問題,多重研究,整合答案來規避不確定性。受到這一啟發,我們通過Agent(代理)來執行這一過程,Agent介于用戶和后端QA系統之間,也就是圖中所示:Environment(知識庫)。
我們把這一代理稱之為AQA,它是一個積極回答問題的策略。AQA旨在通過向知識庫發送重塑過的問題以大化獲取正確答案的幾率。
Agent通過提出諸多相關問題和整合諸多答案來尋找佳答案。Environment(知識庫)的內部對Agent來說是不可用的,所以它必須使用黑盒來探測優問題字符串。
為何該算法如此重要
該算法讓我們了解了機器學習方法的一種,稱之為強化學習。強化學習算法已經被用于機器學習如何玩圍棋,玩電玩,比如Doom(毀滅戰士)。
SEO對這一特別算法很感興趣,因為它可以在用戶和規則排序算法之間插入一個新的算法,并終做出決策。因此,不同的是排序算法是決定搜索引擎結果頁顯示哪些內容,這一機器學習算法是決策佳答案的。
這種排名是和SEO論壇傳統上認為的網頁排名是不同的。傳統的理解是,決定搜索結果中排名1到10的因素有鏈接,網頁標題,錨文本等等。
鏈接對于排名是一個很重要的因素。但是,通過這種算法,鏈接是有助于網頁的排名,但不再是決定性因素。
這一新算法的工作是決定哪些頁面適合回答某個問題。
你是否見過一個鏈接少的網頁排名高于那些鏈接多的網頁?這很可能是在用戶和排序算法之間有一個決定哪個網頁提供佳答案的算法。
排名因素該如何處理?
排名算法不再是網站排名前十的決定性因素,這也是排名因素研究有數百萬結果卻并不準確的原因。排名因素研究認為排名因素對搜索結果前十的網站負有責任。
但排名因素并不是總能決定排名前十的因素。因此排名因素研究也并不完全可靠。
雖然這一特定算法目前還沒有被使用,但是已經有其他的算法通過設置排名算法的結果來執行類似的功能,并使用不是排名因素的因素來重新排序SERPs(搜索結果頁)。
重新排列搜索結果并不是一個新想法。微軟在2005年發布過一篇學術論文,名為:【Improving Web Search Results Using Affinity Graph】(利用關系圖表來改善搜索結果)。這一算法的目的在于為用戶模糊搜索查詢提供更準確的答案。
這一算法對SEO有何影響?
這一算法可能會影響SEO的未來,搜索結果會更加強調滿足用戶的搜索意圖。這一改進又稱之為提高內容相關性。因此,當Google宣布內容相關性的算法更新時,通過研究競爭排名勝出的網站就會知道一個網站丟失排名的佳答案。對于這類更新,如果只是按照傳統簡單的研究丟失網頁排名的網站的內容,是很難找到排名改變的原因的。