Conheça o impacto causado pelos URLs duplicados
Alguns sites, ocasionalmente, disponibilizam o mesmo conteúdo por meio de diferentes URLs usando códigos de sessão ou outros parâmetros de URL. Um código de sessão é um número anexado a um caminho de URL que cria uma nova página com uma experiência personalizada para o visitante do site que corresponde a esse código. Por exemplo, os códigos de sessão possibilitam que um site de compras diferencie clientes de modo que cada pessoa veja o que está em seu carrinho enquanto navega no catálogo. Os parâmetros de URL, por sua vez, são menos específicos para identificar clientes individuais: por exemplo, quando um cliente pesquisa "filhotes" no site de uma petshop, ele tem a opção de filtrar ou classificar os resultados por idade, raça, cor e gama de preços. Cada combinação de filtros representa um URL diferente, pois os filtros acrescentam novas strings ou parâmetros ao caminho de URL original para alterar o que o cliente vê, embora, normalmente, os URLs contenham resultados semelhantes ou duplicados.
Os seguintes URLs apontam para o mesmo conteúdo: uma coleção de vestidos verdes, embora algumas destas páginas possam estar organizadas ou filtradas de forma um pouco diferente.
http://www.example.com/products/women/dresses/green.htm
http://www.example.com/products/women?category=dresses&color=green
http://example.com/shop/index.php?product_id=32&highlight=green+dress&cat_id=1&sessionid=123&affid=431
Quando o Google detecta conteúdo duplicado, como as páginas no exemplo acima, um algoritmo do Google agrupa os URLs duplicados em um cluster e seleciona o URL que ele acredita representar melhor o cluster nos resultados da pesquisa (por exemplo, o Google pode selecionar o URL com a maior parte do conteúdo). O Google, então, tenta consolidar o que sabemos sobre os URLs no cluster, como a popularidade de links, para o URL representante, de modo a melhorar a precisão da classificação de páginas e dos resultados na Pesquisa Google.
Entretanto, quando o Google não consegue encontrar todos os URLs em um cluster ou não pode selecionar o URL representativo que você prefere, é possível usar a ferramenta Parâmetros de URL para fornecer ao Google as informações sobre como lidar com URLs que contêm parâmetros específicos.
Por exemplo, se você pedir ao Google para rastrear um URL com o parâmetro food
ase ele tiver o valor food=savory
, o Google pode não rastrear um URL com food=sweet
em seu caminho de URL. Como resultado, as páginas da Web do site que contêm doces não poderão ser encontradas na Pesquisa do Google.