封鎖對您網站上內容的存取權限

本文說明如何封鎖對您網站上內容的存取權限。

您發佈的部分內容可能不適合納入 Google 新聞,因此您可以封鎖 Google 的檢索機器人 Googlebot 和 Googlebot-News,來限制 Google 存取某些內容。

進一步瞭解如何依據自身需求調整您的新聞設定,包括如何查看更多來自偏好來源的報導,以及如何封鎖不喜歡的新聞來源。

建立 robots.txt 檔案

使用 robots.txt 檔案,您可以精確管理要出現在 Google 搜尋和 Google 新聞網站上的網站內容。進一步瞭解 robots.txt 檔案

您可以透過下列方式封鎖存取權限:

  • 如果不想讓網站內容出現在 Google 新聞網站上,請利用 robots.txt 檔案封鎖 Googlebot-News 的存取權限
  • 如果不想讓網站內容出現在 Google 新聞和 Google 搜尋網站上,請利用 robots.txt 檔案封鎖 Googlebot 的存取權限

您必須開放檢索器存取 robots.txt 檔案的權限,否則我們無法得知您是否指定了不得檢索的網站特定區域。

建立中繼標記

您可以在 HTML 網頁中加入中繼標記。中繼標記能告訴漫遊器不要檢索哪些網頁。進一步瞭解如何使用中繼標記封鎖搜尋索引建立功能

以下列出一些可加入 HTML 網頁中的常見中繼標記:

  • 如果不想讓網站上的特定文章出現在 Google 新聞網站上,請利用下列中繼標記封鎖 Googlebot-News 的存取權限:<meta name="Googlebot-News" content="noindex, nofollow">
  • 如果不想讓網站上的特定文章出現在 Google 新聞和 Google 搜尋網站上,請利用下列中繼標記封鎖 Googlebot 的存取權限:<meta name="googlebot" content="noindex, nofollow">
  • 如果不想讓任何漫遊器將網站上的特定文章編入索引,請利用下列中繼標記:<meta name="robots" content="noindex, nofollow">
  • 如果不想讓漫遊器檢索特定文章中的圖片,請利用下列中繼標記:<meta name="robots" content="noimageindex">
  • 如要通知我們某篇文章應於特定時間從 Google 索引中移除,請利用下列中繼標記:
    <meta name="googlebot" content="unavailable_after: 25-Aug-2011 15:00:00 EST">
    • ​請以 RFC 850 格式指定時間和日期。我們會將此中繼標記視為移除要求。該網頁會在移除日期過後的一天左右從搜尋結果中消失。不過,您必須在我們第一次檢索文章之前就為文章加上標記,這樣標記才能發揮作用。

HTTP 標頭規格

您也可以在 HTTP 標頭中為漫遊器提供指示。詳情請參閱 HTTP 標頭規格
 

注意:Google 會以最嚴格的漫遊器存取權限為準。

這對您有幫助嗎?
我們應如何改進呢?