建立並提交 Sitemap

本頁說明如何建立 Sitemap,以及如何讓 Google 存取 Sitemap。如要進一步瞭解 Sitemap,請參閱這篇文章。

建立並提交 Sitemap:

  1. 決定您要讓 Google 檢索網站上的哪些網頁,同時確認每個網頁的標準版本
  2. 決定要使用的 Sitemap 格式。您可以手動建立 Sitemap,也可以選擇透過各種第三方工具產生 Sitemap。
  3. 使用 Search Console Sitemap 測試工具來測試您的 Sitemap。
  4. 在 robots.txt 檔案中加入您的 Sitemap,或是直接將您的 Sitemap 提交到 Search Console,讓 Google 存取您的 Sitemap

Sitemap 格式

Google 支援數種 Sitemap 格式,以下提供進一步的說明。

不論採用何種格式,單一 Sitemap 的檔案大小上限為 50MB (未壓縮),且其中包含的網址數量最多為 50,000 個。如果您的檔案較大或網址數量較多,則必須將清單分割成數個 Sitemap。您可以選擇建立 Sitemap 索引檔 (指向 Sitemap 清單的檔案),然後將單一索引檔案提交給 Google,也可以將多個 Sitemap 和/或 Sitemap 索引檔提交給 Google。

XML

Google 支援標準 Sitemap 通訊協定,也支援影片圖片新聞資源的 XML 擴充元素。您可以使用這些擴充元素描述網站上的影片檔、圖片和其他不易剖析的內容,協助 Google 提升為這些資源建立索引的效能。

以下是相當基本的 XML Sitemap,其中包含單一網址的位置:

<?xml version="1.0" encoding="UTF-8"?>
<urlset xmlns="http://www.sitemaps.org/schemas/sitemap/0.9"> 
  <url>
    <loc>http://www.example.com/foo.html</loc> 
  </url>
</urlset>

以下是較複雜的 Sitemap,其中包含單一網址,以及該網頁所含資源的圖片和影片檔資訊:

<?xml version="1.0" encoding="UTF-8"?>
<urlset xmlns="http://www.sitemaps.org/schemas/sitemap/0.9" 
  xmlns:image="http://www.google.com/schemas/sitemap-image/1.1" 
  xmlns:video="http://www.google.com/schemas/sitemap-video/1.1">
  <url> 
    <loc>http://www.example.com/foo.html</loc> 
    <image:image>
       <image:loc>http://example.com/image.jpg</image:loc>
       <image:caption>小狗玩牌</image:caption>
    </image:image>
    <video:video>
      <video:content_loc>
        http://www.example.com/video123.flv
      </video:content_loc>
      <video:player_loc allow_embed="yes" autoplay="ap=1">
        http://www.example.com/videoplayer.swf?video=123
      </video:player_loc>
      <video:thumbnail_loc>
        http://www.example.com/thumbs/123.jpg
      </video:thumbnail_loc>
      <video:title>適合夏季的燒烤排餐</video:title>  
      <video:description>
        讓您每次都能料理出最美味的排餐!
      </video:description>
    </video:video>
  </url>
</urlset>
RSS、mRSS 和 Atom 1.0

如果您的網誌含有 RSS 或 Atom 動態消息,可以透過 Sitemap 提交動態消息的網址。大多數網誌軟體均可為您建立動態消息,不過需要注意的是,這類動態消息只會針對最近的網址提供資訊。

  • Google 接受 RSS (簡易聯合發佈) 2.0 與 Atom 1.0 動態消息。
  • 您可以使用 mRSS (媒體 RSS) 動態消息將網站所含影片內容的詳細資訊提供給 Google。
文字

如果您的 Sitemap 中只有網頁網址,則可使用簡單的文字檔案將網址提供給 Google (每行列出一個網址),例如:

http://www.example.com/file1.html
http://www.example.com/file2.html

文字檔 Sitemap 規範:

  • 檔案需使用 UTF-8 編碼。
  • 文字檔不可包含網址清單以外的任何資訊。
  • 文字檔沒有一定的命名規則,不過必須使用 .txt 副檔名 (例如 sitemap.txt)。
Google 協作平台

如果您已經使用 Google 協作平台建立並驗證網站,協作平台會自動為您 Sitemap。您無法修改這個 Sitemap,但如果想要讀取 Sitemap 報告資料,可以將 Sitemap 提交給 Google。請注意,如果單一子目錄中含有超過 1,000 個網頁,Sitemap 可能無法正確顯示。

  • 如果您的網站是由 Google 協作平台代管,則 Sitemap 網址為 http://sites.google.com/site/<您的網站名稱>/system/feeds/sitemap
  • 如果您使用 Google Apps 建立網站,則 Sitemap 網址為 http://sites.google.com/<您的網域>/<您的網站名稱>/system/feeds/sitemap

針對其他媒體類型使用 Sitemap 擴充元素

Google 支援以下媒體類型的 Sitemap 擴充語法。您可以使用這些擴充元素描述您網站上的影片檔、圖片和其他不易剖析的內容,協助 Google 提升索引效能。

Sitemap 通用規範

  • 使用一致且完全符合規定的網址。Google 會完全按照列出的網址進行檢索。舉例來說,如果您的網站位於 http://www.example.com/,請不要將網址指定為 /http://example.com/ (不含 www) 或 ./mypage.html (相對網址)。
  • 請勿加入 Sitemap 中網址的工作階段 ID,以避免重複檢索這些網址。
  • 指出網址的翻譯版本以供 Google 檢索及建立索引,方法是在 Sitemap 檔案中列出每種語言的標準網址,並使用 hreflang 註解
  • Sitemap 檔案必須使用 UTF-8 編碼,並且適當逸出網址
  • 將大型 Sitemap 分割成數個較小的 Sitemap,以免 Google 頻繁要求 Sitemap,造成伺服器發生超載情形。每個 Sitemap 檔案最多只能包含 50,000 個網址,而且解壓縮後的檔案大小不得大於 50 MB。
  • 使用 Sitemap 索引檔,在其中列出您所有 Sitemap 並提交給 Google,而不要提交個別 Sitemap。
  • 如果從您的 www 網域和非 www 網域都能存取您的網站,請使用建議的標準化方法告知 Google。您只需針對偏好的網域提交 Sitemap。
  • 如果您考慮聘請顧問來協助您進行 Sitemap 最佳化作業,請熟讀我們的《網站管理員指南》和《搜尋引擎最佳化 (SEO) 入門指南。此外,諮詢經營相似網站或公司的同業也能幫助您善用 Sitemap。
  • 使用 Sitemap 擴充元素指向其他媒體類型,例如影片、圖片和新聞。
  • 如果行動版和桌面版網頁的網址不同,建議您只需指向其中一種版本。不過,如果您認為有必要指向兩個不同網址,請為網址加上註解來指定桌面版和行動版。
  • 如果您有針對不同語言或地區提供替代網頁,您可以使用 Sitemap 或 hreflang 來指定替代網址。
  • 非英數字元和非拉丁字元。 我們要求您將 Sitemap 檔案以 UTF-8 編碼 (您通常可以在儲存檔案時這麼做)。與所有 XML 檔案一樣,下表所列字元的資料值 (包括網址) 都必須使用實體逸出碼。Sitemap 只能包含 ASCII 字元,不可包含大寫 ASCII 字元、特定控制碼或特殊字元,例如 * 和 {}。如果您的 Sitemap 網址包含這些字元,您新增網址時就會收到錯誤訊息。
    字元 逸出碼
    & 符號 &amp;
    單引號 ' &apos;
    雙引號 " &quot;
    大於 > &gt;
    小於 < &lt;
    此外,所有網址 (包含您 Sitemap 的網址在內) 都必須以網址所在與逸出的網路伺服器可解讀的方式編碼。不過,如果您使用任何類型的指令碼、工具或記錄檔來產生網址 (除了手動輸入外的任何方式),那麼通常這些方式都已經執行此動作。提交 Sitemap 後,如果收到 Google 找不到部分網址的錯誤訊息,請確定您的網址符合 RFC-3986 URI 標準、RFC-3987 IRI 標準及 XML 標準

    以下這個範例網址使用了非 ASCII 字元 (ü) 和需要實體逸出的字元 (&):
    http://www.example.com/ümlat.html&q=name
    以下是同一個網址,但使用了 ISO-8859-1 編碼 (供使用這種編碼的伺服器代管),且網址已逸出:
    http://www.example.com/%FCmlat.html&q=name
    以下是同一個網址,但使用了 UTF-8 編碼 (供使用這種編碼的伺服器代管),且網址已逸出:
    http://www.example.com/%C3%BCmlat.html&amp;q=name
    以下是同一個網址,且實體已逸出:
    http://www.example.com.tw/%C3%BCmlat.html&amp;q=name

讓 Google 存取您的 Sitemap (將您的 Sitemap 提交給 Google)

您可以透過兩種方式讓 Google 存取您的 Sitemap:

排解 Sitemap 問題

請參閱 Sitemap 疑難排解指南

這篇文章實用嗎?
我們應如何改進呢?