Informatie over de impact van dubbele URL's

Bepaalde sites maken dezelfde inhoud soms beschikbaar via verschillende URL's door sessie-ID's of andere URL-parameters te gebruiken. Een sessie-ID is een cijfer dat wordt toegevoegd aan een URL-pad, waardoor een nieuwe pagina wordt gemaakt met een aangepaste ervaring voor de persoon die de site bezoekt en overeenkomt met die ID. Met sessie-ID's kan een winkelsite bijvoorbeeld onderscheid maken tussen klanten zodat elke persoon de artikelen in zijn winkelwagentje kan bekijken terwijl hij bladert in de catalogus op de site. URL-parameters zijn minder specifiek voor het identificeren van afzonderlijke klanten. Wanneer een klant bijvoorbeeld zoekt naar 'puppy's' op de site van een dierenwinkel, heeft hij de optie de resultaten te filteren of te sorteren op leeftijd, ras, kleur en prijsbereik. Elke combinatie van filters vertegenwoordigt vervolgens een andere URL, omdat de filters nieuwe tekenreeksen of parameters toevoegen aan het oorspronkelijke URL-pad om te wijzigen wat de klant te zien krijgt. De URL's bevatten gewoonlijk echter vergelijkbare of dubbele resultaten.

 Voorbeeld

De volgende URL's verwijzen naar dezelfde inhoud, namelijk een collectie groene jurken, hoewel sommige van deze pagina's enigszins anders kunnen zijn ingedeeld of gefilterd.

 http://www.example.com/products/women/dresses/green.htm
 http://www.example.com/products/women?category=dresses&color=green
 http://example.com/shop/index.php?product_id=32&highlight=green+dress&cat_id=1&sessionid=123&affid=431

Wanneer Google dubbele inhoud detecteert, zoals de pagina's in het bovenstaande voorbeeld, groepeert een Google-algoritme de dubbele URL's in één cluster en wordt de URL geselecteerd die volgens het algoritme de beste URL is om het cluster te vertegenwoordigen in zoekresultaten (Google kan bijvoorbeeld de URL met de meeste inhoud selecteren). Google probeert vervolgens de informatie die we hebben over de URL's in het cluster, zoals linkpopulariteit, te consolideren in die ene representatieve URL om uiteindelijk de juistheid van de bijbehorende paginapositie en resultaten op Google Zoeken te verbeteren.

Als Google echter niet alle URL's in een cluster kan vinden of de representatieve URL niet kan selecteren waaraan u de voorkeur geeft, kunt u via de tool URL-parameters Google informatie geven over hoe URL's met specifieke parameters moeten worden verwerkt.

U moet voorzichtig zijn wanneer u de tool 'URL-parameters' gebruikt. Als u een fout maakt wanneer u ons laat weten wat dubbele inhoud is die niet moet worden gecrawld, kan Google ophouden met het crawlen van de pagina's die u op Google Zoeken wilt weergeven.

Als u Google bijvoorbeeld laat weten dat een URL met de parameter food alleen moet worden gecrawld als deze de waarde food=savory heeft, wordt een URL met food=sweet in het bijbehorende URL-pad mogelijk niet gecrawld. Als gevolg hiervan kunnen webpagina's op uw site met zoetigheden niet worden gevonden op Google Zoeken.

HIERNA: UW URL-PARAMETERS INDELEN IN CATEGORIEËN