搜尋演算法的運作方式

網路資訊量龐大,如果沒有適當方法加以過濾,想找出需要的資訊可說是難如登天。為此,我們打造了 Google 排名系統,可將搜尋索引中的數兆個網頁排序,在轉瞬之間為使用者提供最相關的實用搜尋結果,並以方便您查看的方式呈現。

排名系統並非由單一演算法構成,而是包含了一系列的演算法。為了提供您最實用的資訊,搜尋演算法在過濾搜尋結果時會考量多種因素,包括您的查詢字詞、網頁的關聯性和實用性、資訊來源的專業度,以及您的所在位置和設定。系統會根據查詢的性質決定各個因素所占的權重;舉例來說,當您查詢近期新聞主題時,內容的新鮮度就比相關字詞的字典定義來得重要。

為了確保搜尋演算法符合我們對關聯性和品質的高標準,我們制定了嚴謹的程序,包括即時測試,以及在世界各地聘請數千名受過訓練的外部搜尋品質評分者為搜尋品質把關。品質評分者遵循嚴格的指南,其中對於搜尋演算法的目標提供了明確定義,並開放給所有人檢視。

以下為您進一步說明系統會根據哪些關鍵因素來決定查詢的搜尋結果:

  • 分析搜尋字詞

    分析搜尋字詞

    瞭解搜尋內容的意義是傳回有效資訊的重要關鍵。為了找出含有相關資訊的網頁,我們的第一步是分析搜尋查詢的字詞意義。我們會建立語言模型,設法解譯應該在索引中尋找哪些字串。

    所涉步驟就和判讀拼字錯誤一樣簡單,並可運用最新的自然語言解讀研究,進一步判斷你輸入的查詢字詞類型。舉例來說,即使某個查詢字詞有多種定義,但是我們的同義詞系統會協助 Google 搜尋瞭解你要表達的意思。這套系統的開發歷時超過 5 年,並大幅改善了各種語言 30% 的搜尋結果。

    我們也會設法瞭解你要搜尋的資訊類型,像是你要精確查詢特定結果,還是廣泛查詢相關資料?查詢中是否含有「評論」、「圖片」或「營業時間」這類代表特定資訊的字詞?你是否在搜尋代表當天發佈內容的熱門關鍵字?或者,你是否在搜尋附近的商家及找尋當地資訊?

  • 比對搜尋查詢

    比對搜尋查詢

    接著,我們會尋找含有符合查詢內容資訊的網頁。當你執行搜尋時,演算法的基本工作就是在索引中尋找你的搜尋字詞,並找出合適的網頁結果。此外,演算法也會分析這些關鍵字在該網站上的出現頻率和位置 (無論是出現在標題或內文)。

    除了比對關鍵字外,演算法也會尋找各種線索,藉此評估可能的搜尋結果是否與使用者查詢的內容相關。畢竟,當你搜尋「狗」時,要找的多半不會是一個出現「狗」字上百次的網頁。我們會設法判斷網頁是否含有你所查詢的資訊,而不僅是包含查詢字詞而已。因此,搜尋演算法會分析網頁是否包含相關內容,例如狗的相片、影片或是品種清單。最後,我們會確認網頁的語言是否與你的問題相同,以便根據你偏好的語言優先顯示相關網頁結果。

  • 為實用網頁排名

    為實用網頁排名

    一般而言,查詢字串往往都能傳回成千上萬筆可能含有相關資訊的網頁結果。因此,為了優先列出最佳的網頁結果,我們也編寫了可以評估網頁實用性的演算法。

    為了設法找到網路上的最佳資料結果,這些演算法會分析上百項不同因素,例如內容更新時間、搜尋字詞出現次數,以及網頁是否提供良好的使用者體驗。我們會找出許多使用者執行類似查詢時偏好的網站結果,來評估該網站主要內容的可信度和權威性。如果其他相同主題的知名網站中含有連至該網頁的連結,即表示該網頁擁有優質的資訊。

    網路上有許多垃圾網站會試圖使用重複的關鍵字,或是購買可傳遞 PageRank 的連結,經由各種魚目混珠的手法來提升搜尋結果的排名。這些網站的使用者體驗極差,甚至可能傷害或誤導 Google 使用者。為此,我們編寫了能夠識別垃圾內容的演算法,並將違反 Google《網站管理員指南》的網站從搜尋結果移除。

  • 傳回最實用的搜尋結果

    傳回最實用的搜尋結果

    在顯示你的搜尋結果前,我們會評估如何整體呈現所有的相關資訊:搜尋結果是否只與單一主題相關,還是與多個主題相關?是否有過多著重於某一個狹義定義的網頁?我們會盡力根據你的搜尋類型,以最合適的格式向你提供多樣的資訊。此外,隨著網路科技的進步,我們也會不斷改善排名系統,提供更多更優質的搜尋結果。

  • 考量背景資訊

    考量背景資訊

    根據你的位置、過去的搜尋紀錄和搜尋設定等資訊,我們可以為你量身提供最實用且相關的搜尋結果。

    我們會根據你所在的國家/地區和地點提供與當地相關的內容。舉例來說,如果在芝加哥搜尋「足球」,Google 很可能會優先顯示美式足球和芝加哥熊的搜尋結果;但是在倫敦搜尋「足球」,Google 就會優先顯示足球和英格蘭足球超級聯賽的搜尋結果。此外,如果你設定了偏好語言或選用「安全搜尋」工具 (用來排除煽情露骨的搜尋結果),這些搜尋設定也會成為我們判斷搜尋結果實用性的重要依據。

    在某些情況下,我們可能也會參考你最近的搜尋活動資訊來提供個人化的搜尋結果。舉例來說,如果你要搜尋「巴塞隆納」,而且最近搜尋過「巴塞隆納 vs 兵工廠」,系統就會將這項查詢列為重要線索,認定你要查詢的是巴塞隆納足球隊,而不是巴塞隆納這個城市的相關訊息。你可以管理我們能夠參考哪些搜尋活動來提高你的搜尋品質,包括要將哪些資料儲存到你的 Google 帳戶,相關設定位於 myaccount.google.com