Google 搜尋的運作方式

瞭解 Google 如何尋找、檢索並提供網頁

Google 的運作方式是什麼?本文提供了簡短版本和詳細版本的說明。

Google 會從不同來源取得各種資訊,包括:

  • 網頁
  • 使用者提交的內容 (例如使用者在 Google 我的商家和 Google 我的地圖中提交的資料)
  • 書籍掃描
  • 網際網路上的公開資料庫
  • 以及許多其他來源

不過,本文說明將以網頁為主。

簡短說明

Google 會依照三個基本步驟產生網頁搜尋結果:

檢索

第一個步驟是找出網路上有哪些網頁。由於網頁並沒有統一登錄的地方,Google 必須持續搜尋新網頁,並將這些網頁新增到已知網頁清單中;所謂部分網頁屬於已知網頁,因為 Google 先前已經造訪過這些網頁。Google 會追蹤已知網頁的連結並連到新網頁,以此發現其他未知的網頁。此外,當網站擁有者提交網頁清單 (Sitemap) 供 Google 檢索時,我們也會找到其他網頁。如果你使用受管理網站代管商的服務 (例如 Wix 或 Blogger),他們可能會通知 Google 檢索你更新或新增的任何網頁。

Google 會在找到網頁網址後造訪該網頁 (也就是「檢索」),藉此瞭解其中的內容。Google 會轉譯該網頁,對文字內容、非文字內容以及整體視覺版面配置進行分析,決定網頁在搜尋結果中的顯示位置。Google 越瞭解你的網站,就越能在使用者尋找你的內容時,更準確地找到你的網站。

如何提升網站檢索成效:

  • 請確認 Google 可以存取你網站上的網頁,且這些網頁都能正確顯示。Google 會以匿名使用者身分 (也就是沒有密碼或資訊的使用者) 存取網路,同時,Google 也應該要能看到網頁上的所有圖片和其他元素,才能正確理解網頁內容。你可以在行動裝置相容性測試工具中輸入網頁的網址,快速進行檢查。
  • 如果你建立或更新了單一網頁,可以向 Google 提交個別網址。如果想一次告知 Google 多個新網頁或更新後的網頁,請使用 Sitemap
  • 如果你只想讓 Google 檢索一個網頁,請讓我們檢索首頁對於 Google 來說,首頁是你網站中最重要的網頁。如要幫助 Google 對你的網站進行完整檢索,請務必在首頁 (以及所有網頁) 中加入完善的網站導覽系統,藉此連結至網站中所有重要部分和網頁,以便協助使用者 (和 Google) 在瀏覽網站時可以輕鬆找到所需網頁。如果你的網站較小 (少於 1,000 個網頁),那麼你只需要讓 Google 知道首頁的位址即可。有了這項資訊,Google 就能以你的首頁為起點,透過追蹤連結的路徑,找到其他所有網頁。
  • 將你的網頁連結到 Google 已知的其他網頁。但是請注意,Google 不會追蹤廣告中的連結、你在其他網站中的付費連結、留言中的連結,或其他不符合 Google 網站管理員指南規定的連結。

 

Google 不接受任何網站以付費的方式增加檢索頻率或提高排名。如果有人告訴你可以這樣做,請注意這並非事實。

建立索引

找到網頁之後,Google 會嘗試解讀網頁內容;這項程序稱為「建立索引」。Google 會分析網頁內容、為網頁內嵌的圖片和影片檔案編目,同時採取其他方式,嘗試解讀網頁。我們會將解讀後所得到的資訊儲存至「Google 索引」,這是一個規模龐大的資料庫,分散儲存在數量驚人的電腦中。

如何提升網頁索引成效:

  • 建立簡短而有意義的網頁標題。
  • 使用能傳達頁面主題的網頁標題。
  • 使用文字而非圖片來傳達內容 (Google 能夠解讀部分圖片和影片,但效果不如文字來得好。請至少使用替代文字和其他屬性,為影片圖片加上適當註解)。

傳回搜尋結果 (和排名)

當使用者輸入查詢時,Google 會根據多種因素嘗試從索引中找出關聯性最高的結果。Google 會考量使用者的所在位置、語言和裝置 (電腦或手機) 等條件來判斷最佳搜尋結果,同時也會考慮其他影響因素,儘可能提供最佳使用體驗和最適合的搜尋結果。舉例來說,位於巴黎和香港的使用者搜尋「單車維修店」時看到的結果就不一樣。Google 不接受以付費方式提高網頁排名,排名是經由程式產生。

如何改善搜尋結果和排名:

詳細說明

想瞭解更多資訊嗎?歡迎參閱以下說明:

詳細說明

檢索

「檢索」是指 Googlebot 造訪新網頁或已更新網頁,並將它們加入 Google 索引中的程序。

我們使用大量電腦來擷取 (也就是「檢索」) 網路上數十億的網頁,用來擷取網頁的程式名為 Googlebot (又稱為漫遊器或自動尋檢程式)。Googlebot 會使用特定的演算程序來決定要檢索的網站、檢索頻率,以及要從每個網站擷取的網頁數量。

Google 一開始會根據先前的檢索程序所產生的網頁網址清單,再結合網站管理員所提供的 Sitemap 資料,逐一檢索各個網頁。當 Googlebot 造訪網頁時,會尋找網頁上的連結,並將這些連結新增至待檢索網頁清單。系統會記錄任何新網站、現有網站變動和無效連結,並以此更新 Google 索引。

在檢索期間,Google 會使用最新版本的 Chrome 轉譯網頁,並於轉譯程序中執行檢索器找到的任何網頁指令碼。如果你的網站使用動態產生的內容,請務必遵循 JavaScript 搜尋引擎最佳化 (SEO) 基礎知識

主要檢索/次要檢索

Google 會使用兩種不同的檢索器來檢索網站:行動裝置檢索器和電腦檢索器。每種檢索器都會模擬使用者透過該類裝置造訪網頁的情況。

Google 會使用其中一種檢索器 (可能是行動裝置或電腦) 做為網站的「主要檢索器」,該網站上所有由 Google 檢索的網頁都會使用主要檢索器完成。所有新網站的主要檢索器都會是行動裝置檢索器。

除此之外,Google 會使用另一種檢索器 (可能是行動裝置或電腦) 重新檢索網站上的部分網頁,這就是所謂的「次要檢索」,可讓你瞭解網站與其他裝置類型的相容性。

Google 如何得知不要檢索哪些網頁?

  • 遭到 robots.txt 封鎖的網頁不會列入檢索範圍,但如果該網頁連結至其他網頁,則 Google 仍可能會為其建立索引 (Google 可根據指向網頁的連結來推斷網頁內容,而且無須剖析網頁內容即可為其建立索引)。
  • Google 無法檢索任何禁止匿名使用者存取的網頁,因此任何登入規定或其他授權保護機制都會使 Google 無法檢索網頁。
  • 如果 Google 在檢索某個網頁後判定其為重複網頁,就會降低對該網頁的檢索頻率。

改善檢索成效

你可以採用下列做法協助 Google 找到你網站上的正確網頁:

建立索引

Googlebot 會處理檢索的每個網頁,藉此瞭解網頁內容,這包括處理文字內容、關鍵內容標記和屬性 (例如 <title> 標記和替代屬性)、圖片、影片等。不過,Googlebot 雖然可以處理多種內容類型,但並未涵蓋所有內容類型,比方說某些互動式多媒體檔案的內容就不在 Googlebot 的處理範圍之內。

Google 在進行檢索到建立索引之間的過程中,會判斷網頁是標準網頁或重複網頁,若判定是重複網頁,則會降低對於該網頁的檢索頻率。系統會將類似的網頁歸納成一份「文件」,這份文件會包含一組有一或多個網頁的群組,而這些網頁包括標準網頁 (最能代表該群組的網頁) 以及系統找到的任何重複網頁 (可能只是能夠前往同樣網頁的替代網址,或是同一個網頁針對行動裝置或電腦提供的替代版本)。

請注意,Google 不會為含有 noindex 指令 (標頭或標記) 的網頁建立索引,但前提是檢索器必須能看到指令。如果網頁遭到 robots.txt 檔案、登入頁面或其他裝置封鎖,就算 Google 並未造訪該網頁,仍可能為其建立索引!

改善索引成效

你可以運用下列做法讓 Google 更加瞭解網頁內容:

什麼是「文件」?

Google 內部會以一組「文件」集的形式代表網路,且這組文件集的規模相當龐大。文件集中的每份文件都代表一或多個網頁,這些網頁可能彼此相同或者非常類似,且內容在本質上都是相同的,只是透過不同網址存取的結果。文件中的不同網址可能會導向完全相同的網頁 (例如 example.com/dresses/summer/1234 和 example.com?product=1234 可能會顯示同一個網頁),或者會導向同一個網頁針對不同裝置使用者顯示的微調版本 (例如針對電腦使用者顯示 example.com/mypage,針對行動使用者顯示 m.example.com/mypage)。

Google 會從每份文件的網址中選擇一個,將其定義為該文件的「標準網址」,而這個標準網址會是 Google 最常檢索及建立索引的網址。系統會將其他網址視為「重複網址」或「替代網址」,並且偶爾進行檢索,或是根據使用者的搜尋要求顯示於搜尋結果中。舉例來說,如果文件的標準網址是行動網址,Google 可能還是會為透過電腦搜尋的使用者提供電腦版網址 (也就是替代網址)。

Search Console 中的大部分報告都會將資料歸給文件的標準網址。有些工具支援測試替代網址 (例如檢查網址工具),不過,檢查標準網址也能夠提供替代網址的相關資訊。

你可以告訴 Google 你認為哪個網址是標準網址,但 Google 可能會基於各種原因選擇其他標準網址。

以下提供我們所用字詞的摘要,以及這些字詞在 Search Console 中的用法:

  • 文件:由類似網頁組成的集合。每份文件都會有一個標準網址,如果你的網站有重複網頁,文件中也會包含可能的替代網址。文件中的網址可以來自相同或不同的「機構」 (也就是根網域,例如 www.google.com 中的「google」)。Google 會根據平台 (行動裝置/電腦)、使用者語言 或位置等眾多變數,選擇最適合顯示在搜尋結果中的網址。針對你網站上的相關網頁,Google 會透過自然檢索或是網站中實作的功能 (例如重新導向或 <link rel=alternate/canonical> 標記) 進行探索,如果相關網頁位於其他組織,就必須由你的網站明確編碼後 (透過重新導向或連結標記),系統才會將其標示為替代網頁。
  • 網址:用來開啟網站中特定內容的網址。不同的網址經過網站解析後,可能會指向同一個網頁。
  • 網頁:可以由一或多個網址開啟的特定網頁,其「版本」可能會因使用者的平台而異 (例如行動裝置、電腦、平板電腦等)。
  • 版本:網頁的其中一個變化版本,通常可歸類為「行動版」、「電腦版」和「AMP」(不過 AMP 網頁可能也會有自己的行動版和電腦版網頁)。各個版本可以使用不同網址 (例如 example.com 和 m.example.com),也可以使用相同網址,視你的網站設定而定。舉例來說,如果你的網站使用動態服務回應式網頁設計,就能以同樣的網址顯示同一個網頁的不同版本。系統不會將同一個網頁的不同語言版本視為不同的「版本」,而是會將它們歸納成不同的「文件」。
  • 標準網頁或標準網址:Google 判斷一份文件中最具代表性的網址。每次檢索時,Google 都會檢索這個網址,有時候也會檢索文件中的重複網址。
  • 替代/重複網頁或替代/重複網址:Google 有時會檢索的文件網址。Google 也會視使用者和搜尋要求不同提供適合的網址 (舉例來說,針對來自電腦的搜尋要求,系統會提供適合電腦使用者的替代網址,而不是標準行動網址)。
  • 網站:通常指一組概念上相關的網頁集合。不過有時也會用來指稱 Search Console 資源,雖然一項資源實際上只能定義為單一網站的一部分。每個網站都可以跨多個子網域 (在正確連結 AMP 網頁的情況下,甚至能跨多個機構)。

系統會將擁有相同內容的不同語言網頁儲存在不同文件中,並使用 hreflang 標記互相參照;這也就是為什麼我們會建議你為經過翻譯的內容使用 hreflang 標記,這點非常重要。

傳回搜尋結果

使用者輸入查詢字詞時,我們的系統會搜尋索引資料庫,並找出符合的網頁,再傳回我們認為與使用者的查詢內容最相關的結果。搜尋關聯性取決於數百種因素,而且我們仍不斷努力改進演算法。Google 在選擇搜尋結果及調整排名時會考量使用者體驗,因此請確認你的網頁可快速載入並且適合行動裝置瀏覽

改善你的搜尋結果

  • 如果你的網站是針對特定地區或語言的使用者所設計,請告知 Google 你的目標對象
  • 確保你的網頁可快速載入而且適合行動裝置瀏覽
  • 遵循網站管理員指南,避免常見錯誤並改善網站排名。
  • 考慮為網站實作搜尋結果功能,例如食譜資訊卡或文章資訊卡。
  • 實作 AMP 可更快速地在行動裝置上載入網頁。部分 AMP 網頁也可以使用焦點新聞輪轉介面等其他搜尋功能。
  • Google 會持續改進演算法;因此與其嘗試猜測演算法規則並據此設計網頁,還不如依循我們的規範,用心創造令人耳目一新且切合使用者需求的優質內容。

進階詳細說明

如需 Google 搜尋服務運作方式的詳盡說明與細節,請造訪這個網站 (內附圖片和影片!)

這對您有幫助嗎?
我們應如何改進呢?