禁止檢索參數化重複內容

網址參數工具的使用時機與方式

網址參數和重複內容

如果您的網站會使用網址參數來顯示無關緊要的網頁變化版本 (例如 color=redcolor=green),或是使用參數在不同網址 (例如 example.com/shirts?style=polo,long-sleeveexample.com/shirts?style=polo&style=long-sleeve) 顯示大致相同的內容,就可能導致 Google 無法有效率地檢索您的網站。

舉例來說,以下這幾個只有參數不同的網址都會指向大致重複的內容:

網址 說明
https://example.com/products/women/dresses/green.html 不含參數的靜態網頁。
https://example.com/products/women?category=dresses&color=green 網址使用 categorycolor 參數,但和不含參數的網頁提供的是相同內容。
https://example.com/products/women/dresses/green.html?limit=20&sessionid=123 網址中含有限制搜尋結果數量的參數和使用者的工作階段 ID,但和以上網址提供的是相同內容。

如果您的網站運用了許多這類網址參數,您也許能利用網址參數工具來減少搜尋引擎檢索重複網址的情形。

重要資訊:如果您的網站是在「不含參數」的不同網址上提供重複內容,那麼請不要按照本文中的說明禁止檢索作業,而是改為定義標準網頁

禁止檢索含有特定參數的網址

您可以禁止 Google 檢索含有特定參數的網址,或是參數為特定值的網址,藉此避免發生檢索重複網頁的情況。

需求條件

您的網站必須符合下列所有條件,才能使用網址參數工具。

  • 您的網站有超過 1,000 個網頁。
  • 您的記錄顯示 Googlebot 已為大量重複網頁建立索引,而且這些重複網頁的差異只在於網址參數 (例如:example.com?product=green_dressexample.com?type=dress&color=green)。
不當使用警告
 
如果您是經驗豐富的搜尋引擎最佳化專員,您的網站也完全符合上述需求條件,我們才建議您使用網址參數工具,因為這項工具若使用不當,可能會導致 Google 忽略您網站上的重要網頁,從而無法針對這些網頁顯示警告或回報錯誤。雖然這樣的後果聽起來有點嚴重,但這多半是濫用或不必要地使用所造成。因此,如果您不確定自己能否妥善運用這項工具,那麼最好還是不要輕易使用。

使用方式

您可以指定當 Google 檢索到您的網站中含有特定參數的網址時,該採取何種處理方式。但須注意,這種參數處理方式將適用於整個網站,不可能限制成只適用於特定網址或網站的分支版本。

如何使用網址參數工具:

  1. 確認您的網站符合上述需求條件。
  2. 開啟網址參數工具
  3. 點選 [編輯] 編輯現有參數,或是點選 [建立參數] 建立新參數。請注意,由於這項工具會區分大小寫,因此必須輸入和網址完全相符的參數名稱。
  4. 指明網址參數是否會影響頁面內容:
    • 否:不會影響頁面內容:參數不會影響頁面內容的呈現方式。這種參數可能用來追蹤訪客和參照網址,對網頁實際內容沒有影響,例如 sessionIDuserName。當 Google 找到多個很類似、只有這個參數值有區別的網址時,就只會檢索其中一個網址。雖然 Google 會設法偵測這類參數,但如果您的記錄指出我們並未正確辨識這類靜態參數,您可以在這裡指定。
    • 是:會變更、重新排序或限制網頁內容:參數會變更網頁內容。例如 brandgendercountrysortorder。請選擇參數用途:
      • 排序 (例如 sort=price_ascending):變更顯示內容的順序。
      • 限制 (例如 t-shirt_size=XS):篩選網頁上的內容。
      • 指定 (例如 store=women):決定網頁上顯示的內容一般類別。如果這個參數指向一個明確項目,而且是存取該內容的唯一途徑,請選取 [檢索內含這個參數的所有網址]。
      • 翻譯 (例如 lang=fr):顯示經過翻譯的內容。如果您使用參數的目的是顯示不同語言版本的網頁內容,那麼您「應該」使用 hreflang 指出網頁的不同語言版本,讓 Google 檢索翻譯版本的網頁,而不是用這項工具封鎖內容。
      • 編排頁次 (例如 page=2):顯示長篇資訊或文章的特定頁次。
         
      • Googlebot 應該檢索哪些含有這個參數的網址? 選擇下列選項,指定 Google 應如何處理包含這類參數的網址:
        • 讓 Googlebot 決定:這是已知參數的預設設定。如果您不確定參數的行為,或者參數的行為會因為網站的不同部分而產生變化,請選取這個選項。Googlebot 會分析您的網站,決定處理參數的最佳方式。
        • 檢索內含這個參數的所有網址:告訴 Google 不要封鎖任何含有這個參數的網址。擁有這個唯一參數值的網址不會包含重複內容。舉例來說,您為包含 productid 參數的網址實作了這類設定後,Google 會自動將 http://www.example.com/dresses/real.htm?productid=1202938http://www.example.com/dresses/real.htm?productid=5853729 視為截然不同的網址,因為兩個網址具備不同的 productid 參數值。
        • 僅檢索含有值的網址:告訴 Google 只要檢索網址參數已設為指定值的網址即可,無須檢索含有其他參數值的網址。如果網站使用該參數值變更內容的順序 (否則會顯示相同的內容),則特別適合選取這個選項。舉例來說,http://www.example.com/dresses/real.htm?sort=price_highhttp://www.example.com/dresses/real.htm?sort=price_low 擁有相同的內容。您可以使用這項設定告訴 Googlebot,只對含有 sort=price_low 的網址進行檢索,以免檢索重複的內容。
        • 不會檢索含有這個參數的網址:告訴 Google 無須檢索任何包含特定參數的網址。Google 不會對任何含有指定參數的網址進行檢索。您可以告訴 Google,如果網址含有 pricefrompriceto 則不要加以檢索,以免針對重複的內容進行不必要的檢索。舉例來說,http://www.examples.com/search?category=shoe&brand=nike&color=red&size=5&pricefrom=10&priceto=1000http://www.examples.com/search?category=shoe&brand=nike&color=red&size=5 含有相同的內容,因此只需檢索後者即可。
  5. 如果您的網站在網址中使用多個參數,請參閱管理包含多個參數的網址
  6. 請注意,其他資源可能沿用您的規則 (請參閱沿用參數規則)。

沿用參數規則

如果您分別擁有 http 和 https 的資源,或者父項和子項的資源 (例如 example.com 和 example.com/fr/),依照下列規則,這些資源可能會「沿用」您的參數設定:

  • http/https:如果只有一項 http 或 https 資源擁有規則,規則會同時套用至兩者。如果 http 和 https 資源已各自定義了規則,則會各自套用各自的規則。
  • 父項/子項:如果父項資源 (example.com) 擁有參數規則,則「沒有」參數規則的任何子項資源 (example.com/fr/) 就會沿用這些規則;「擁有」參數規則的任何子項資源則使用自己的規則。請注意,系統也會將子網域 (m.example.com) 視為上層網域 (example.com) 的子項資源。

管理包含多個參數的網址

一個網址可包含多個參數,您可以為個別參數指定檢索設定。如果一個網址包含多個受管理的參數,Google 會根據下列規則來決定是否要檢索網址:

限制較多的參數設定會覆寫限制較少的參數設定。

舉例來說,以下分別是三個網址參數的 Google 檢索設定:

參數 參數檢索設定
shopping-category 檢索包含這個參數的所有網址
sort-by 僅檢索含有 = production-year 值的網址
sort-order 僅檢索含有 = asc 值的網址

 

範例 1

http://www.example.com?shopping-category=shoes&sort-by=size&sort-order=asc

即使這個網址包含有效的 sort-order 值 (asc),Google 仍然不會檢索這個網址,因為 sort-by 這個參數沒有設為 production-year

範例 2

http://www.example.com?shopping-category=DVD-movies&sort-by=production-year&sort-order=asc

Google 會檢索這個網址,因為 sort-bysort-order 值符合允許的設定。

範例 3

http://www.example.com/shoes/33453

http://www.example.com?country=fr

Google 會檢索這兩個網址,因為它們沒有系統標記的參數。

這篇文章實用嗎?
我們應如何改進呢?