使用網站專用的 Google 模擬器

測試 Google 能否檢索您的網頁

「Google 模擬器」工具可供您測試 Google 如何檢索或轉譯您網站上的網址。您可以使用 Google 模擬器查看 Googlebot 是否能夠存取網站上的網頁、Googlebot 轉譯網頁的方式,以及是否有任何禁止 Googlebot 存取的網頁資源 (例如圖片或指令碼)。這項工具可以按照 Google 一般的檢索與轉譯程序來模擬檢索和轉譯作業,協助您排除網站的檢索問題。

開啟網站專用的 Google 模擬器

如果您要測試的是行動應用程式,請使用應用程式專用的 Google 模擬器工具

執行擷取作業

  1. 在文字方塊中,輸入網站內任一網頁網址的路徑部分 (相對於網站根目錄),讓 Googlebot 進行擷取。如果將文字方塊留空,Googlebot 會擷取網站根網頁。舉例來說,如果目前的資源是 http://example.com,當您指定 stores/indiana/1234.html 時,Googlebot 會擷取 http://example.com/stores/indiana/1234.html
    擷取限制:
    • 擷取的網址僅限於目前的網站:舉例來說,如果目前的 Search Console 資源是指向 http://example.com,則無法擷取來自 https://example.comhttp://m.example.com 的網址。
    • 擷取過程中不會傳送任何 Cookie、登入資訊或其他狀態資訊。
    • 這項擷取程序並不會追蹤重新導向連結。如果擷取的網頁設有重新導向,您必須按照下方「重新導向」擷取狀態說明中所述的方式自行連往重新導向的目標網頁。
  2. 必要時,可指定要模擬擷取的 Googlebot 類型。 系統將根據您的設定,採用不同類型的檢索器進行擷取;如果您選擇「擷取並轉譯」,轉譯方式也會不太一樣。可選用的 Googlebot 類型如下:
    1. 電腦 [預設] -
      • 網站:使用 Googlebot 檢索器。
      • 新聞:使用 Googlebot 檢索器 (非 Googlebot 新聞)。
      • 圖片:使用 Googlebot 圖片檢索器。
      • 影片:使用 Googlebot 影片檢索器。
      • 含 AdSense 程式碼的網頁:使用 Google AdSense 檢索器。
      • 廣告到達網頁:使用 Google AdsBot 檢索器。
    2. 行動裝置:智慧型手機
      • 目前 - 使用現有版本的 Google 智慧型手機檢索器 (即將更換為新版本)。
      • 未來 - 使用最新版本的 Google 智慧型手機檢索器。
  3. 點選 [擷取] 或 [擷取並轉譯]
    • 擷取:擷取網站中指定的網址,並且顯示 HTTP 回應。這項作業不會要求或執行網頁上任何相關的資源 (例如圖片或指令碼)。這項作業相對來說速度較快,可讓您檢查網站上可疑的網路連線或安全性問題,或對此進行偵錯,並且查看這個要求是否成功。
    • 擷取並轉譯:擷取網站中指定的網址並顯示 HTTP 回應,同時根據指定的平台 (電腦或智慧型手機) 轉譯網頁。這項作業會要求並執行網頁上所有的資源 (例如圖片或程式碼)。您可以藉此偵測出 Googlebot 和使用者所見的網頁畫面之間有何不同。
  4. 系統會將這項要求新增至擷取記錄表格,並標註為「待處理」狀態。要求處理完畢後,該資料列會顯示要求是否成功,以及一些基本資訊。點選表格中任一未顯示為失敗的擷取列,即可取得該要求的其他詳細資訊,包括原始 HTTP 回應標頭和資料、(針對「擷取並轉譯」要求) 封鎖的資源清單,以及轉譯網頁檢視畫面。
  5. 如果要求成功,且提出要求的時間未滿 4 小時,您可以要求 Google 重新檢索已擷取的網頁並重新建立索引 (也可以選擇任何與擷取的網頁連結的網頁)。

每天您可執行 10 次擷取作業。接近此上限時,系統會在網頁中顯示通知。

要求擷取狀態

主頁面上的擷取記錄表格會顯示最近 100 次擷取要求。如要查看已完成的擷取作業詳細資訊,請在擷取記錄表格中點選相應的資料列。系統可能顯示的要求擷取狀態如下:

  • 完成:Google 成功連上您的網站並已檢索您的網頁,順利取得了網頁參照的所有資源。點選表格中的資料列可查看更多關於擷取結果的詳細資訊。
  • 部分完成:Google 取得了您網站的回應並已擷取網址,但因遭到 robots.txt 檔案封鎖而無法連上網頁參照的部分網址。如果是單純的擷取作業,請執行擷取並轉譯作業。檢查經過轉譯的網頁中有無任何重要的資源遭到封鎖,導致 Google 無法正確分析網頁的意涵。如有重要的資源遭到封鎖,請在您所擁有的 robots.txt 檔案中解除封鎖這些資源。如果封鎖重要資源的 robots.txt 檔案非您所擁有,請要求資源網站擁有者解除封鎖這些資源,讓 Googlebot 能順利存取。請參閱資源擷取錯誤說明清單
  • 已重新導向:伺服器回應含有重新導向。Google 模擬器工具不會追蹤重新導向連結。雖然實際上 Google 檢索器會追蹤重新導向連結,但 Google 模擬器工具不會這麼做。因此,您必須以人工方式進行追蹤:
    • 如果重新導向的目標是同一個資源,Google 模擬器工具會顯示按鈕,讓您在擷取欄中填入重新導向網址,以便快速追蹤重新導向連結。
    • 如果網址重新導向到您擁有的其他資源,您可以點選 [追蹤],讓系統自動填寫網址欄,複製網址後切換查看新網站,再將該網址貼入擷取欄中。
    您可以在擷取詳細資料頁面檢查 HTTP 回應,查看重新導向的詳細資訊。如要瞭解詳情,請找出 HTTP 錯誤代碼。伺服器或網頁本身的中繼標記/JavaScript 都有可能觸發重新導向。
  • 特定錯誤類型... 任何資源類型擷取錯誤都可能對應到整個網頁的擷取要求,並且顯示在狀態欄中 (例如:找不到無法連上)。

資源擷取錯誤

如果擷取要求所顯示的狀態是部分完成,您可以點選該項要求,開啟「要求詳細資訊」頁面,其中的表格會列出系統遇到的所有錯誤。一般來說,發生錯誤的原因是網頁上的資源遭到封鎖。以下是擷取要求可能發生的各種資源錯誤:

資源擷取錯誤清單
狀態 說明 注意事項和後續步驟

找不到

找不到資源 (404 或 410 HTTP 回應碼)。

出現這個錯誤,表示當您使用網路瀏覽器存取這個網頁時,可能會顯示 HTTP 404 錯誤代碼。

未授權

Googlebot 沒有存取網頁的權限 (例如需要密碼才能存取網頁)。

出現這個錯誤,表示當您使用網路瀏覽器存取這個網頁時,可能會顯示 HTTP 403 錯誤代碼。

找不到 DNS

Google 找不到網域名稱,因此無法擷取資源。

請務必輸入正確的網域名稱 (例如 www.example.com),Google 才能找到您的網站伺服器。

遭到封鎖

資源主機使用 robots.txt 檔案封鎖了 Googlebot 的存取權。

如果資源遭到封鎖,可能會影響 Google 對於網頁的解讀結果,以及特定查詢的網頁排名。遭封鎖的資源皆設有嚴重程度值,用於衡量該資源在 Google 解讀網頁時的影響程度。

  • :缺少的資源對網頁轉譯結果的影響很小。
  • :缺少的資源對網頁轉譯結果有一些影響;請檢查擷取的網頁,看看實際網頁中遺漏或出現差異的部分是否會影響 Google 對該網頁的解讀。
  • :缺少的資源對網頁轉譯結果的影響很大,很可能會改變 Google 將該網頁編入索引的方式。
  • -- (雙破折號):擷取錯誤不是因為資源遭到封鎖所致。

您可以更新自己的 robots.txt 檔案來修正這個錯誤。如果您的資源位址在網域的根層級 (例如 www.example.com,而不是 www.example.com/<我的網站>/),可使用 robots.txt 測試工具來診斷網址遭到封鎖,導致 Google 無法擷取的原因。

無法連上 robots.txt

Googlebot 無法存取資源主機的 robots.txt 檔案。發生這種情況時,Google 會避免從該主機載入任何資源。

如要解決這個問題,請參閱說明中心文章,瞭解如何建立及測試 robots.txt 檔案

無法連上

資源主機回應時間過長或拒絕要求。

請檢查您的伺服器是否正常運作。

暫時無法連上

1) Google 模擬器目前無法擷取您的網址,因為伺服器的回應時間過長。

2) Google 模擬器取消了您的擷取作業,因為伺服器連續收到太多不同網址的要求。

請注意,並非所有 Google 服務都無法存取這個網址,這項錯誤只代表 Google 模擬器這項模擬工具無法連上該網址。

錯誤

發生不明錯誤,導致 Google 無法完成擷取作業。

如果再次出現這個錯誤,請前往網站管理員說明論壇提問。
這篇文章實用嗎?
我們應如何改進呢?