Google 搜尋的運作方式

瞭解 Google 如何尋找、檢索並提供網頁

Google 的運作方式是什麼?本文提供了簡短版本和詳細版本的說明。

Google 會在不同地區取得各種資訊,包括:

  • 網頁
  • 使用者提交的內容 (例如使用者在 Google 我的商家和 Google 我的地圖中提交的資料)
  • 書籍掃描
  • 網際網路上的公開資料庫
  • 以及許多其他來源

不過,本文說明將以網頁為主。

簡短說明

Google 會依照三個基本步驟產生網頁搜尋結果:

檢索

第一個步驟是找出網路上有哪些網頁。由於網頁並沒有統一登錄的地方,Google 必須持續搜尋新網頁,並新增到已知網頁的清單;這項探查程序稱為「檢索

先前 Google 已檢索過部分網頁,因此這些網頁屬於已知頁面。當 Google 追蹤已知頁面的連結而連到新網頁時,就會發現其他網頁。此外,當網站擁有者提交網頁清單 (Sitemap) 供 Google 檢索時,我們也會找到其他網頁。如果您使用受管理的網站代管商 (例如 Wix 或 Blogger),則代管商可能會通知 Google 檢索您製作的任何更新或新增網頁。

如何提升網站檢索成效:

  • 如果是單一網頁有變動,您可以向 Google 提交個別網址
  • 將您的網頁連結到 Google 已知的其他網頁。但是請注意,我們不會追蹤廣告中的連結、您在其他網站中的付費連結、留言中的連結,或其他不符合《Google 網站管理員指南》的連結。

 

Google 不接受任何網站要求以付費方式增加檢索頻率或提高排名。如果有人告訴您可以這樣做,請注意這並非事實。

建立索引

找到網頁之後,Google 會嘗試解讀網頁內容;這項程序稱為「建立索引」。Google 會分析網頁內容、為網頁內嵌的圖片和影片檔案編目,以及透過其他方式嘗試解讀網頁。我們會將這類資訊儲存至「Google 索引中;Google 索引是使用大量電腦 (數量很驚人!) 儲存的巨大資料庫。

如何提升網頁索引成效:

  • 建立簡短而有意義的網頁標題。
  • 使用可傳達頁面主題的網頁標題。
  • 使用文字而非圖片來傳達內容 (Google 能夠解讀部分圖片和影片,但效果不如文字來得好。請至少使用替代文字和其他屬性為影片圖片加上適當註解)。

傳回搜尋結果 (和排名)

當使用者輸入查詢時,Google 會根據多種因素嘗試從索引中找出關聯性最高的結果。Google 會考量使用者的所在位置、語言和裝置 (電腦或手機) 等條件來判斷最佳搜尋結果,同時也會考慮其他影響因素,儘可能提供最佳使用體驗和最適合的搜尋結果。舉例來說,位於巴黎和香港的使用者搜尋「單車維修店」時看到的結果就不一樣。Google 不接受以付費方式提高網頁排名,排名是經由程式產生。

如何改善搜尋結果和排名:

詳細說明

想瞭解更多資訊嗎?歡迎參閱以下說明:

詳細說明

 

檢索

檢索是指 Googlebot 發現可加入 Google 索引中的新網頁或更新網頁的程序。

我們使用大量電腦來抓取 (也就是「檢索」) 網路上數十億的網頁。用來抓取網頁的程式名為 Googlebot (又稱為漫遊器或自動尋檢程式)。Googlebot 會使用一種演算程序,由電腦程式決定要檢索的網站、檢索頻率,以及要從每個網站抓取的網頁數量。

Google 一開始會根據先前的檢索程序所產生的網頁網址清單,再結合網站管理員所提供的 Sitemap 資料,逐一檢索各個網頁。Googlebot 造訪這些網站時,會偵測每個網頁內的連結,並將這些連結新增到要檢索的網頁清單;任何新網站、現有網站的變更和無效連結都會被記錄下來,並用來更新 Google 的索引資料。

Google 如何找到網頁?

Google 利用許多技術來尋找網頁,包括:

  • 追蹤其他網站或網頁的連結
  • 讀取 Sitemap

Google 如何得知不要檢索哪些網頁?

  • 遭到 robots.txt 封鎖的網頁不會列入檢索範圍,但如果該網頁連結至其他網頁,則 Google 仍可能會為其建立索引 (Google 可根據指向網頁的連結來推斷網頁內容,而且無須剖析網頁內容即可為其建立索引)。
  • Google 無法檢索任何禁止匿名使用者存取的網頁,因此任何登入規定或其他授權保護機制都會使 Google 無法檢索網頁。

改善檢索成效

您可以採用下列做法協助 Google 找到您網站上的正確網頁:

建立索引

Googlebot 會處理檢索的每個頁面,將各個網頁中檢索到字詞及其位置編譯成龐大的索引。此外,我們也會處理包括在關鍵內容標記和屬性 (例如 <title> 標記和 alt 屬性) 中的資訊。不過,Googlebot 雖然可以處理多種內容類型,但並未涵蓋所有內容類型,比方說某些多媒體檔案的內容就不在 Googlebot 的處理範圍之內。

請注意,系統不會檢索含有 noindex 指令 (標題或標記) 的網頁,但前提是要讓檢索器發現指令。如果網頁只是遭到 robots.txt 檔案、登入頁面或其他裝置封鎖,就算 Google 並未造訪該網頁,仍可能為其建立索引!

改善索引成效

您可以運用下列做法讓 Google 更加瞭解網頁內容:

傳回搜尋結果

使用者輸入查詢字詞時,我們的系統會搜尋索引資料庫,並找出符合的網頁,再傳回我們認為與使用者的查詢內容最相關的結果。搜尋關聯性取決於 200 多項因素,而且我們仍不斷努力改進演算法。Google 會根據使用者體驗選擇搜尋結果及調整排名,因此請確認您的網頁可快速載入並且適合透過行動裝置瀏覽

改善您的搜尋結果

  • 如果您的網站是針對特定地區或語言的使用者所設計,請告知 Google 您的目標對象
  • 確認您的網頁可快速載入而且適合透過行動裝置瀏覽
  • 遵循《網站管理員指南》,避免常見錯誤並改善網站排名。
  • 考慮為網站實作搜尋結果功能,例如食譜資訊卡或文章資訊卡。
  • 實作 AMP 可更快速地在行動裝置上載入網頁。部分 AMP 網頁也可以使用焦點新聞輪轉介面等其他搜尋功能。
  • Google 會持續改進演算法;因此與其嘗試猜測演算法規則並據此設計網頁,還不如依循我們的規範,用心創造令人耳目一新且切合使用者需求的優質內容。

進階詳細說明

如要進一步瞭解 Google 搜尋服務運作方式的詳盡說明與細節,請造訪這裡 (內附圖片和影片!)

這篇文章實用嗎?
我們應如何改進呢?