Поиск
Удалить поисковый запрос
Закрыть поиск
Приложения Google
Главное меню

Как создавать и отправлять файлы Sitemap

Из этого руководства вы узнаете, как создать файл Sitemap и предоставить к нему доступ роботам Google.

Как создавать и отправлять файлы Sitemap

  1. Решите, какие страницы вашего сайта должны сканировать поисковые роботы Google, и определите канонические URL для каждой из них. 
  2. Определите, какой формат файла Sitemap нужно использовать. Создать файлы Sitemap можно как вручную, так и автоматически с помощью сторонних инструментов.
  3. Проверьте файл Sitemap.
  4. Сделайте файл доступны для Google, добавив его в robots.txt и отправив в Search Console.

Форматы файлов Sitemap

Google поддерживает несколько форматов файлов Sitemap, описанные здесь.

Для всех форматов действуют следующие ограничения: файл Sitemap может содержать не более 50 000 URL, а его размер в несжатом виде не должен превышать 50 МБ. Если объем файла или количество перечисленных в нем адресов превышают эти пределы, разбейте его на несколько частей. Вы можете создать файл индекса Sitemap, перечислив в нем все файлы Sitemap, и отправить их в Google все сразу.

XML

Google поддерживает стандартный протокол Sitemap, а также расширения XML для видео, изображений и новостей. С их помощью можно добавлять описания видео, изображений и другого контента, чтобы он лучше индексировался.

Вот пример простого XML-файла Sitemap с одним URL:


<?xml version="1.0" encoding="UTF-8"?>
<urlset xmlns="http://www.sitemaps.org/schemas/sitemap/0.9"> 
  <url>
    <loc>http://www.example.com/foo.html</loc> 
  </url>
</urlset>

Вот более сложный пример, содержащий один URL и сведения о графических и видеоресурсах на странице:


<?xml version="1.0" encoding="UTF-8"?>
<urlset xmlns="http://www.sitemaps.org/schemas/sitemap/0.9" 
  xmlns:image="http://www.google.com/schemas/sitemap-image/1.1" 
  xmlns:video="http://www.google.com/schemas/sitemap-video/1.1">
  <url> 
    <loc>http://www.example.com/foo.html</loc> 
    <image:image>
       <image:loc>http://example.com/image.jpg</image:loc>
       <image:caption>Собаки играют в покер</image:caption>
    </image:image>
    <video:video>
      <video:content_loc>
        http://www.example.com/video123.flv
      </video:content_loc>
      <video:player_loc allow_embed="yes" autoplay="ap=1">
        http://www.example.com/videoplayer.swf?video=123
      </video:player_loc>
      <video:thumbnail_loc>
        http://www.example.com/thumbs/123.jpg
      </video:thumbnail_loc>
      <video:title>Как приготовить стейк</video:title>  
      <video:description>
        Лучшие рецепты стейков.
      </video:description>
    </video:video>
  </url>
</urlset>
RSS, mRSS и Atom 1.0

Если у вас есть блог с фидом RSS или Atom, можно отправить URL этого фида в качестве источника файла Sitemap. Большинство сервисов для ведения блогов позволяют создать фид, но нужно учитывать, что в нем может быть представлена информация только о последних URL.

  • Google допускает использование каналов RSS (Real Simple Syndication) 2.0 и Atom 1.0.
  • Отправить в Google сведения о видеоконтенте можно также с помощью фида mRSS (media RSS).
Текстовый файл

Если в файле Sitemap есть только адреса страниц, вы можете отправить Google обычный текстовый файл с этими URL (по одному в каждой строке). Пример:


http://www.example.com/file1.html
http://www.example.com/file2.html

Рекомендации по текстовым файлам Sitemap

  • Необходимо использовать кодировку UTF-8.
  • Файл не должен содержать ничего, кроме списка URL.
  • Этому текстовому файлу можно дать любое имя, но необходимо использовать расширение .txt (например, sitemap.txt).
Сайты Google

Если сайт был создан и подтвержден с помощью сервиса "Google Сайты", файл Sitemap создается автоматически. Его нельзя изменить, но можно отправить в Google, чтобы получать сведения для отчетов. Обратите внимание, что если в одном подкаталоге содержится более 1000 страниц, файл Sitemap может отображаться некорректно.

  • Если ваши страницы размещены на Google Сайтах, файл Sitemap должен находиться по адресу http://sites.google.com/site/VashSait/system/feeds/sitemap.
  • Если сайт создан с помощью Google Apps, URL файла Sitemap должен быть таким: http://sites.google.com/VashDomen/VashSait/system/feeds/sitemap.

Общие рекомендации по файлам Sitemap

  • Используйте один и тот же синтаксис при указании URL. Google будет сканировать их в точности по списку. Например, если сайт размещен по адресу http://www.example.com/, не используйте URL /http://example.com/ (без www) или ./MoyaStranitsa.html (относительный URL).
  • Не указывайте в добавляемых URL идентификаторы сессий – это может привести к избыточному сканированию страниц.
  • Добавляйте в файл Sitemap информацию о переведенных страницах для их сканирования и индексирования. Это можно сделать с помощью атрибутов hreflang.
  • Файлы Sitemap должны использовать кодировку UTF-8, а в URL необходимо применять экранирование.
  • Разбивайте большие файлы Sitemap на файлы поменьше, чтобы снизить нагрузку на сервер при отправке информации в Google. Файл Sitemap может содержать не более 50 000 URL, а его размер в несжатом виде не должен превышать 50 МБ.
  • Создайте файл индекса Sitemap, перечислив в нем все файлы Sitemap, и отправьте его в Google вместо отдельных файлов.
  • Используйте рекомендуемые методы канонизации URL, чтобы сообщить Google о версии домена, для которой составлен файл Sitemap (если сайт доступен как с www, так и без www). В этом случае потребуется только один файл Sitemap.
  • Ознакомьтесь с рекомендациями для веб-мастеров и руководством по поисковой оптимизации, если вы планируете обратиться к специалисту, который поможет вам оптимизировать файлы Sitemap. Также мы рекомендуем посоветоваться с владельцами схожих сайтов или аналогичных компаний.
  • Применяйте только цифры и латинские буквы. Файл Sitemap обязательно должен быть в кодировке UTF-8 (обычно ее можно выбрать при сохранении). Во всех файлах XML для любых значений данных (включая URL) необходимо применять маскирование элементов при использовании символов, перечисленных в таблице ниже.  Файл Sitemap может содержать только символы ASCII. В нем не должно быть расширенных символов ASCII, определенных управляющих кодов и специальных символов, таких как * и {}. Если они указаны в URL, то при попытке обработать такой файл появится сообщение об ошибке.
    Символ Маскирование
    Амперсанд & &amp;
    Одинарные кавычки ' &apos;
    Двойные кавычки " &quot;
    Больше чем > &gt;
    Меньше чем < &lt;
    Кроме того, все URL (включая адреса в вашем файле Sitemap) должны быть защищены. Также используйте кодирование, чтобы веб-серверу было проще их обрабатывать. Однако если для создания URL вы применяете какой-либо сценарий, инструмент или файл журнала, то есть не вводите адреса вручную, обычно это выполняется автоматически. Если при отправке файла Sitemap вы получаете оповещение о том, что Google не удалось найти ваши URL, убедитесь, что они соответствуют стандарту RFC-3986 для URI, стандарту RFC-3987 для IRI и стандарту XML.

    Ниже представлен пример URL, в котором содержится символ, не относящийся к кодировке ASCII (ü), а также символ, требующий маскирования (&).
    http://www.example.com/ümlat.html&q=name
    Этот же URL, переведенный в кодировку ISO-8859-1 (для размещения на сервере, использующем эту кодировку) и содержащий маскирование:
    http://www.example.com/%FCmlat.html&q=name
    Этот же URL, переведенный в кодировку UTF-8 (для размещения на сервере, использующем эту кодировку) и содержащий маскирование:
    http://www.example.com/%C3%BCmlat.html&amp;q=name
    Этот же URL, содержащий маскирование:
    http://www.example.com/%C3%BCmlat.html&amp;q=name

Расширения файлов Sitemap

Google поддерживает расширенный синтаксис в файле Sitemap для приведенных ниже типов информации. С его помощью можно добавлять описание видео, изображений и другого контента для улучшения его индексации.

Как сделать файл Sitemap доступным для Google

Предоставить Google доступ к файлу Sitemap можно двумя способами:

Устранение ошибок в файле Sitemap

Ознакомьтесь с этим руководством.

Была ли эта статья полезна?
Как можно улучшить эту статью?