Bloquear o rastreamento de conteúdo duplicado parametrizado

Quando e como usar a ferramenta Parâmetros de URL

Parâmetros de URL e conteúdo duplicado

Caso seu site use parâmetros de URL para variações de página insignificantes (por exemplo, color=red e color=green) ou que mostrem essencialmente o mesmo conteúdo usando URLs diferentes (por exemplo, example.com/shirts?style=polo,long-sleeve e example.com/shirts?style=polo&style=long-sleeve), talvez o Google rastreie o site de forma ineficiente.

Veja um exemplo de URLs que direcionam a conteúdo duplicado, diferenciado somente por parâmetros diferentes:

URL Descrição
https://example.com/products/women/dresses/green.html Página estática não parametrizada
https://example.com/products/women?category=dresses&color=green O URL usa os parâmetros category e color para fornecer o mesmo conteúdo que a página não parametrizada.
https://example.com/products/women/dresses/green.html?limit=20&sessionid=123 O URL inclui parâmetros para limitar o número de resultados e um código de sessão para exibir o mesmo conteúdo ao usuário.

Caso haja muitos parâmetros de URL no site, use a ferramenta Parâmetros de URL para reduzir o rastreamento de URLs duplicados.

Importante: caso seu site veicule conteúdo duplicado para URLs diferentes sem usar parâmetros, defina uma página canônica em vez de bloquear o rastreamento, conforme descrito nesta página.

Bloquear o rastreamento de URLs que contêm parâmetros específicos

É possível impedir que o Google rastreie URLs que têm parâmetros específicos ou com determinados valores para evitar o rastreamento de páginas duplicadas.

Requisitos

Use a ferramenta Parâmetros de URL somente se o site atender a TODOS os requisitos a seguir.

  • Seu site tem mais de 1.000 páginas.
  • Seus registros apresentam um número significativo de páginas duplicadas indexadas pelo Googlebot, com variações somente nos parâmetros de URL (por exemplo: example.com?product=green_dress e example.com?type=dress&color=green).
Aviso de uso incorreto
 
Use a ferramenta Parâmetros de URL somente se o site atender aos requisitos acima e você tiver experiência com SEO. O uso incorreto dessa ferramenta pode fazer com que o Google ignore páginas importantes do site sem aviso nem relatórios sobre as páginas ignoradas. Essa situação indesejada ocorre com muitas pessoas que usam a ferramenta de maneira inadequada ou desnecessária. Não use esse recurso caso não saiba usá-lo corretamente.

Uso

Você pode especificar o comportamento do Google ao rastrear seu site com parâmetros específicos. O comportamento do parâmetro se aplica a toda a propriedade. Não é possível limitar o comportamento de rastreamento de um parâmetro a um URL ou ramificação específica do seu site.

Para usar a ferramenta Parâmetros de URL, faça o seguinte:

  1. Verifique se o site atende aos requisitos indicados anteriormente.
  2. Abra a ferramenta Parâmetros de URL.
  3. Edite um parâmetro existente ou clique em Adicionar parâmetro para criar um novo parâmetro. Essa ferramenta diferencia maiúsculas de minúsculas. Por isso, digite o parâmetro exatamente como ele aparece no URL.
  4. Especifique se o parâmetro de URL afeta o conteúdo da página:
    • Não: ele não afeta o conteúdo da página: o parâmetro não afeta como o conteúdo da página é apresentado. Esse tipo de parâmetro pode ser usado para rastrear visitas e referenciadores, mas não afeta o conteúdo real da página. Por exemplo, sessionID ou userName. Se o Google encontrar muitos URLs com somente esse valor de parâmetro diferente, ele rastreará um deles. O Google tenta detectar esses tipos de parâmetros. No entanto, se os registros indicarem que não estamos identificando esse parâmetro estático corretamente, especifique-o aqui.
    • Sim: ele altera, reorganiza ou restringe o conteúdo da página: o parâmetro pode alterar o conteúdo da página. Por exemplo: brand , gender , country ou sortorder. Escolha a finalidade do parâmetro:
      • Classificação (por exemplo, sort=price_ascending): altera a ordem em que o conteúdo é apresentado.
      • Limitação (por exemplo, t-shirt_size=XS): filtra o conteúdo na página.
      • Especificação (por exemplo, store=women): determina o tipo de conteúdo exibido na página. Caso o parâmetro especifique um item exato e essa seja a única maneira de acessar esse conteúdo, selecione "Cada URL" para o comportamento.
      • Tradução (por exemplo, lang=fr): exibe uma versão traduzida do conteúdo. Ao usar um parâmetro para exibir idiomas diferentes, é recomendável permitir que o Google rastreie as versões traduzidas, usando hreflang para indicar as variantes de idioma da página, em vez de bloquear o conteúdo com essa ferramenta.
      • Paginação (por exemplo, page=2): exibe uma página específica de uma listagem ou um artigo longo. Também é possível indicar conteúdo paginado diretamente.
         
      • Quais URLs com este parâmetro o Googlebot deve rastrear? Escolha uma opção para indicar o comportamento do Google ao encontrar URLs que contêm esse parâmetro:
        • Permitir que o Googlebot decida: é a configuração padrão para parâmetros conhecidos. Selecione-a se você não tiver certeza sobre o comportamento de um parâmetro ou se o comportamento mudar em partes diferentes do site. O Googlebot pode analisar seu site para determinar a melhor forma de lidar com o parâmetro.
        • Cada URL: solicita que o Google nunca bloqueie URLs com esse parâmetro. URLs com valores únicos desse parâmetro não têm conteúdo duplicado. Por exemplo, após implementar esse tipo de configuração para URLs com o parâmetro productid, o Google automaticamente considerará o URL http://ww.example.com/dresses/real.htm?productid=1202938 como totalmente diferente de http://www.example.com/dresses/real.htm?productid=5853729 porque o valor do parâmetro productid de cada URL será diferente.
        • Somente URLs com o valor: solicita que o Google rastreie somente URLs com um valor específico do parâmetro. Os URLs com um valor de parâmetro diferente não serão indexados. Essa opção é útil caso seu website utilize o valor do parâmetro para alterar a ordem na qual o conteúdo idêntico é exibido. Por exemplo, http://www.example.com/dresses/real.htm?sort=price_high tem o mesmo conteúdo de http://www.example.com/dresses/real.htm?sort=price_low. Use essa configuração para dizer ao Googlebot que rastreie somente os URLs com sort=price_low para evitar o rastreamento de conteúdo duplicado.
        • Sem URLs: solicita que o Google não rastreie URLs com um parâmetro específico. O Google não rastreará URLs com o parâmetro inserido. Por exemplo, informe ao Google que ele não deve rastrear URLs com parâmetros como pricefrom e priceto (como http://www.examples.com/search?category=shoe&brand=nike&color=red&size=5&pricefrom=10&priceto=1000) para evitar o rastreamento desnecessário de conteúdo duplicado já disponível a partir de http://www.examples.com/search?category=shoe&brand=nike&color=red&size=5.
  5. Caso seu site use vários parâmetros em um URL, consulte o artigo Gerenciar URLs com vários parâmetros.
  6. Suas regras podem ser herdadas por outras propriedades. Consulte Herança de regras de parâmetro.

Herança de regras de parâmetro

Caso você tenha propriedades separadas para http e https ou propriedades pai e filho diferentes (por exemplo, example.com e example.com/fr/, example.com e m.example.com), as configurações de parâmetro poderão ser herdadas entre as propriedades de acordo com estas regras:

  • http / https: se apenas uma das propriedades http ou https tiver regras, elas serão aplicadas a ambas. Caso as propriedades http e https tenham regras próprias definidas, somente as regras correspondentes serão aplicadas.
  • Pai/filho: se a propriedade pai (example.com) tiver regras de parâmetro, todas as propriedades filhas (example.com/fr/) sem regras de parâmetro herdarão essas regras. No entanto, as propriedades filhas com regras de parâmetro usarão somente as regras próprias. Os subdomínios (m.example.com) são considerados filhos do domínio pai (example.com).

Gerenciar URLs com vários parâmetros

Um único URL pode conter vários parâmetros. É possível especificar as configurações de rastreamento para cada um deles separadamente. Se um único URL tiver vários parâmetros gerenciados, o Google obedecerá à regra a seguir para decidir se o URL será rastreado:

As configurações de parâmetro mais restritivas substituem as menos restritivas.

Por exemplo, veja abaixo três parâmetros de URL e as respectivas configurações de rastreamento do Google:

Parâmetro Configurações de rastreamento de parâmetro
shopping-category Rastrear todos os URLs com este parâmetro
sort-by Rastrear somente URLs com o valor = production-year
sort-order Rastrear somente URLs com o valor = asc

 

Exemplo 1

http://www.example.com?shopping-category=shoes&sort-by=size&sort-order=asc.

O Google não rastreará esse URL porque o parâmetro sort-by não está definido como production-year, embora o URL tenha um valor válido de sort-order (asc)

Exemplo 2

http://www.example.com?shopping-category=DVD-movies&sort-by=production-year&sort-order=asc.

O Google pode rastrear esse URL porque os valores de sort-by e sort-order correspondem às configurações permitidas.

Exemplo 3

http://www.example.com/shoes/33453

http://www.example.com?country=fr

O Google pode rastrear os dois URLs porque eles não têm parâmetros sinalizados.

Este artigo foi útil para você?
Como podemos melhorá-lo?