保持簡單的網址結構

網站的網址結構應該儘可能簡單。請試著組織您的內容,以有邏輯的方式來架構網址,讓人容易理解 (可以的話,請盡量使用可閱讀的字詞而非冗長的 ID 數字)。舉例來說,如果您要搜尋航空的相關資訊,「http://en.wikipedia.org/wiki/Aviation」這樣的網址將有助於您決定是否要按下這個連結;而像「http://www.example.com/index.php?id_sezione=360&sid=3a5ebc944f41daa6f849f730f1」這樣的網址就比較不容易吸引使用者。

您可以試著在網址中使用標點符號。http://www.example.com/green-dress.html 這樣的網址比 http://www.example.com/greendress.html 更實用。建議您在網址中使用連字號 (-),而不要使用底線 (_)。

太過複雜的網址,特別是那些包含多個變數的網址,可能會導致檢索器建立不尋常的大量網址並全都指向您網站上相同或類似的內容,因而發生問題。Googlebot 可能會因此而平白佔用更多頻寬,也可能無法完全為您網站的所有內容建立索引。

這個問題的常見原因

造成大量不尋常網址的原因可能有很多種,包括:

  • 重複篩選一組項目。許多網站會針對同一組項目或搜尋結果提供不同的呈現方式,通常允許使用者用已定義的條件篩選項目組 (例如:顯示海灘上的旅館)。當篩選器可以用多重的方式加以組合時 (例如: 海灘上的旅館,同時附有健身中心),則網站中的網址數 (檢視資料) 會大幅增加。建立大量只有些微差異的旅館清單並無必要,因為 Googlebot 僅需要查看小部分的清單即可觸及每個旅館的網頁。舉例來說:
    • 「平價」旅館:
      http://www.example.com/hotel-search-results.jsp?Ne=292&N=461
    • 海灘上的「平價」旅館:
      http://www.example.com/hotel-search-results.jsp?Ne=292&N=461+4294967240
    • 海灘上附有健身中心的「平價」旅館:
      http://www.example.com/hotel-search-results.jsp?Ne=292&N=461+4294967240+4294967270

  • 動態產生文件。可能因為計數器、時間戳記或廣告而產生小幅度的變動。

  • 網址中的問題參數。舉例來說,工作階段 ID 會建立大量重複項目和更多的網址。

  • 排序參數。 有些大型購物網站提供多種方式來排序相同的項目,因而產生大量的網址。例如:
    http://www.example.com/results?search_type=search_videos&search_query=tpb&search_sort=relevance
       &search_category=25
  • 網址中的無關參數,像是推薦連結參數。 例如:
    http://www.example.com/search/noheaders?click=6EE2BF1AF6A3D705D5561B7C3564D9C2&clickPage=
       OPD+Product+Page&cat=79
    http://www.example.com/discuss/showthread.php?referrerid=249406&threadid=535913
    http://www.example.com/products/products.asp?N=200063&Ne=500955&ref=foo%2Cbar&Cn=Accessories.

  • 日曆問題。 動態產生的日曆可能產生指向未來與過去日期,而不限制起始或結束日期的連結。例如:
    http://www.example.com/calendar.php?d=13&m=8&y=2011
    http://www.example.com/calendar/cgi?2008&month=jan

  • 損毀的相關聯結。 損毀的相關連結可能會導致無數空格。這樣的問題通常是重複的路徑元素所造成。例如:
    http://www.example.com/index.shtml/discuss/category/school/061121/html/interview/
      category/health/070223/html/category/business/070302/html/category/community/070413/html/FAQ.htm
解決這個問題的步驟

如要避免網址結構可能造成的問題,我們提供您下列建議:

  • 您可試著使用 robots.txt 檔案來禁止 Googlebot 存取有問題的網址。一般說來,您應該考慮封鎖動態的網址,例如:產生搜尋結果的網址,或是可能建立無數空格的網址 (例如日曆)。只要在 robots.txt 檔案中使用規則運算式,即可輕鬆封鎖大量網址。

  • 儘可能避免在網址中使用工作階段 ID,並考慮改用 Cookie。如需更多資訊,請參閱《網站管理員指南》。

  • 刪去不必要的參數,儘可能縮短網址。

  • 如果您的網站有無限日曆,請將 nofollow 屬性新增至指向動態產生的未來日曆網頁的連結。

  • 檢查您的網站是否有損毀的相關連結。
這對您有幫助嗎?
我們應如何改進呢?