Como utilizar caracteres que não são alfanuméricos em URLs do sitemap

É necessário que o arquivo de Sitemap use a codificação UTF-8. Esse procedimento pode ser feito no momento que você salva o arquivo. Assim como em todos os arquivos XML, quaisquer valores de dados (inclusive os URLs) devem usar códigos de escape de entidade para os caracteres listados na tabela abaixo.

Caractere Código de escape
E comercial & &
Aspas simples ' '
Aspas duplas " "
Maior que > >
Menor que < &lt;

Além disso, todos os URLs (inclusive o URL de seu sitemap) devem ser codificados para capacidade de leitura pelo servidor da Web em que eles estão localizados e com escape do URL. No entanto, se você usa qualquer tipo de arquivo de registro, ferramenta ou script para gerar os URLs (qualquer coisa exceto digitá-los manualmente), isso geralmente é feito para você. Se você enviar seu sitemap e receber um erro informando que o Google não pôde encontrar alguns de seus URLs, verifique se os URLs seguem o padrão RFC-3986 para URIs, o padrão RFC-3987 para IRIs e o padrão XML.

Veja abaixo um exemplo de um URL que utiliza um caractere não ASCII (ü) e um caractere que requer código de escape de entidade (&):

  http://www.example.com/ümlat.html&q=name

Observe abaixo o mesmo URL, ISO-8859-1 codificado (para hospedagem em um servidor que usa esse tipo de codificação) e o escape do URL:

  http://www.example.com/%FCmlat.html&q=name

Consulte a seguir o mesmo URL, a codificação UTF-8 (para a hospedagem em um servidor que usa esse tipo de codificação) e o escape do URL:

  http://www.example.com/%C3%BCmlat.html&q=name

Observe abaixo o mesmo URL com escape de entidade:

  http://www.example.com/%C3%BCmlat.html&amp;q=name

Além disso, ele pode conter somente caracteres ASCII. Ele não pode conter caracteres ASCII maiúsculos nem determinados códigos de controle ou caracteres especiais, como * e {}. Se o URL de seu sitemap tiver esses caracteres, ocorrerá um erro quando você tentar adicioná-lo.