Feedfetcher

Google 會使用 Feedfetcher 來擷取 Google Play 書報攤PubSubHubbub 的 RSS 或 Atom 動態饋給。Feedfetcher 會收集並定期重新整理這些使用者啟用的資訊提供,但不會在「網誌搜尋」或 Google 的其他搜尋服務中為這些資訊提供建立索引 (只有由 Googlebot 檢索的資訊提供才會出現在我們的搜尋結果中)。如要瞭解這個由使用者控制的資訊提供收集工具如何運作,請參閱下方常見問題的解答。


如何要求 Google 不要擷取部分或整個網站的動態饋給?

當使用者新增使用 Feedfetcher 資料的服務或應用程式時,Google 的 Feedfetcher 會嘗試取得並顯示資訊提供的內容。Feedfetcher 的要求來自於使用者的明確指示,而不是由自動檢索器來控制,因此 Feedfetcher 不會遵循 robots.txt 的指示。

如果您的資訊提供是公開的,那麼 Google 就無法禁止使用者存取您的資訊提供。您可以將網站設定成向使用者代理程式 Feedfetcher-Google 送出 404、410 或其他錯誤狀態訊息。

如果您的資訊提供是由網誌或網站代管服務所提供,請您直接要求該服務限制使用者存取您的資訊提供。

Feedfetcher 多久擷取一次我的資訊提供?

平均而言,Feedfetcher 擷取大部分網站的頻率最多一個小時一次。某些時常更新網站的重新整理次數可能會更頻繁。但是請注意,如果出現網路延遲的情況,Feedfetcher 可能會較為頻繁地擷取您的資訊提供,但這只是暫時性的現象

為什麼 Feedfetcher 試圖從我的伺服器下載不正確的連結,或試圖從不存在的伺服器進行下載?

Feedfetcher 會根據使用者安裝的服務或應用程式中的要求來擷取資訊提供。所以可能的情況是,使用者要求不存在的資訊提供網址位置。

為什麼 Feedfetcher 會從我們的「秘密」網路伺服器下載資訊?

Feedfetcher 會根據使用者安裝的服務或應用程式中的要求來擷取資訊提供。所以可能的情況是,要求擷取該資訊提供的使用者知道您的「秘密」伺服器,或不小心打錯網址,結果擷取到您的「秘密」伺服器。

為什麼 Feedfetcher 沒有依照我的 robots.txt 檔案中的指示運作?

只有當使用者啟動的服務或應用程式要求資訊提供資料時,Feedfetcher 才會擷取資訊提供。Feedfetcher 是以人類使用者的直接代理人 (不是機器人) 的身分來行動,所以會忽略 robots.txt 中的指示。但是 Feedfetcher 的一項優點是:因為 Feedfetcher 是以多位使用者的代理人身分來執行動作,可以一次針對所有使用者要求一般動態饋給,因此可以節省頻寬。

您可以調整伺服器設定,將 404、410 或其他錯誤狀態訊息傳送給使用者代理程式 Feedfetcher-Google,禁止 Feedfetcher 檢索您的網站。

我發現有多部機器的點閱活動都是來自 Google.com,而且使用者代理程式都是 Feedfetcher,為什麼會這樣?

Feedfetcher 能夠分散在多台機器上運作,藉此提升執行效能,並配合網路規模的成長而擴充。為了減少頻寬使用量,我們通常會使用離要擷取的網站最接近的機器來進行網路擷取。

我想要篩選記錄,是否能告訴我 Feedfetcher 提出要求的 IP 位址?

Feedfetcher 使用的 IP 位址會隨時變更。如果您想確認 Feedfetcher 的存取活動,最好的方法就是利用它的使用者代理程式 Feedfetcher-Google,即可看出其存取活動。

為什麼 Feedfetcher 多次從我的網站下載同一個網頁?

在一般的情況下,Feedfetcher 會在擷取資訊提供的時間內,從您的網站下載每一個檔案的複本一次。但是有些時候,我們的機器會停止運作,然後重新開機,導致 Feedfetcher 又再一次擷取最近才造訪過的網頁。

Feedfetcher 會追蹤哪些類型的連結?

與一般網路檢索器不同,Feedfetcher 並不會追蹤連結;當使用者在採用 Feedfetcher 的服務或應用程式中提出要求時,Feedfetcher 才會針對要求進行追蹤。

我還有其他 Feedfetcher 的相關問題,哪裡可以取得更多說明?

如果您還有其他問題,歡迎將您的問題張貼在 Search Console 論壇中。

這對您有幫助嗎?
我們應如何改進呢?