Google probeert uw site zo efficiënt mogelijk te crawlen. Het crawlen en indexeren van pagina's met identieke inhoud is immers inefficiënt voor ons. Dit inefficiënte gebruik van middelen zou het aantal pagina's kunnen beperken dat we op uw site kunnen crawlen, en dubbele inhoud in onze index kan bovendien een negatief effect hebben op de prestaties van uw pagina's in onze zoekresultaten. Dubbele inhoud komt vaak voor wanneer sites dezelfde inhoud beschikbaar stellen via verschillende URL's, bijvoorbeeld door sessie-id's of andere parameters te gebruiken, zoals hier:
http://www.example.com/producten/dames/jurken/groen.htm http://www.example.com/producten/dames?category=jurken&color=groen http://example.com/winkel/index.php?product_id=32&highlight=groen+jurk&cat_id=1&sessionid=123&affid=431
In dit geval verwijzen al deze URL's naar dezelfde inhoud: een collectie groene jurken.
Wanneer Google dubbele inhoud detecteert, zoals varianten met verschillende URL-parameters, groeperen we de dubbele URL's in één cluster en selecteren we wat we de 'beste' URL vinden om deze cluster in zoekresultaten te vertegenwoordigen. We voegen de eigenschappen van de URL's in de cluster, zoals de linkpopulariteit, aan de representatieve URL toe. Door eigenschappen van URL's samen te voegen tot één representatieve URL, kunnen we gebruikers vaak nauwkeurigere zoekresultaten bieden.
We raden u aan het hulpprogramma voor parameterbehandeling te gebruiken om Google te laten weten hoe URL's met specifieke parameters moeten worden behandeld, zodat u het indexeringsproces van uw site kunt verbeteren. We proberen rekening te houden met deze informatie, maar er kunnen gevallen voorkomen waarin de voorgestelde suggesties meer kwaad dan goed doen.
Over het algemeen vallen URL-parameters in een van twee categorieën:
- Parameters die de pagina-inhoud niet aanpassen: bijvoorbeeld
sessionidofaffiliateid. Parameters zoals deze worden vaak gebruikt om bezoeken en verwijzingen bij te houden. Ze hebben geen effect op de daadwerkelijke inhoud van de pagina. Zo verwijzen de volgende URL's allemaal naar precies dezelfde inhoud:http://www.example.com/producten/dames/jurken?sessionid=12345 http://www.example.com/producten/dames/jurken?sessionid=34567 http://www.example.com/producten/dames/jurken?sessionid=34567&source=google.com - Parameters die de inhoud van een pagina aanpassen of bepalen: bijvoorbeeld
brand,gender,countryofsortorder. Zo kan een parameter het volgende effect hebben op pagina-inhoud:- Sorteren (bijvoorbeeld
sort=price_ascending): hiermee wordt de volgorde aangepast waarin de inhoud wordt gepresenteerd. - Verfijnen (bijvoorbeeld
t-shirt_size=XS): hiermee wordt de inhoud op de pagina gefilterd. - Specificeren (bijvoorbeeld
store=women): hiermee wordt bepaald welke inhoudsset op een pagina wordt weergegeven. - Vertalen (bijvoorbeeld
lang=fr): hiermee wordt een vertaalde versie van de inhoud weergegeven. - Pagineren (bijvoorbeeld
page=2): hiermee wordt een specifieke pagina uit een langere vermelding of artikel weergegeven. - Anders: hiermee wordt inhoud op andere dan de hierboven beschreven manieren gewijzigd.
- Sorteren (bijvoorbeeld
We raden u aan het hulpprogramma voor URL-parameters te gebruiken om Google te laten weten wat het doel is van de parameters die u op uw site gebruikt en hoe URL's met deze parameters moeten worden verwerkt.
- Klik op het Dashboard bij Siteconfiguratie op URL-parameter.
- Klik naast de betreffende parameter op Bewerken. (Als de parameter niet wordt vermeld, klikt u op Parameter toevoegen. Dit hulpprogramma is hoofdlettergevoelig, dus zorg ervoor dat u de parameter precies zo invoert als deze in uw URL wordt weergegeven.)
- Als de parameter geen effect heeft op de inhoud die aan de gebruiker wordt weergegeven, selecteert u Nee... in de lijst Heeft deze parameter effect... en klikt u op Opslaan. Als de parameter wel effect heeft op de manier waarop inhoud wordt weergegeven, klikt u op Ja: de parameter wijzigt, reorganiseert of verfijnt de pagina-inhoud en selecteert u vervolgens hoe Google URL's met deze parameter moet crawlen.
- Laat Googlebot beslissen. Selecteer deze optie als u niet zeker weet wat de parameter doet of als het gedrag verschillend is voor verschillende delen van de site. Googlebot analyseert uw site om te bepalen hoe de parameter het best kan worden behandeld. Dit is een goede algemene optie.
- Elke URL. Googlebot gebruikt de waarde van deze parameter om te bepalen of een URL uniek is. Zo wordt
www.example.com/jurken/real.htm?productid=1202938als een volledig andere URL beschouwd danwww.example.com/jurken/real.htm?productid=5853729. Controleer voordat u deze optie selecteert of de parameter inderdaad effect heeft op de pagina-inhoud; anders crawlt Google mogelijk onnodig dubbele inhoud op uw site. - Alleen URL's met waarde=x. Googlebot crawlt alleen de URL's waarvan de waarde van de parameter overeenkomt met deze gespecificeerde waarde. URL's met een andere parameterwaarde worden niet gecrawld. Dit kan bijvoorbeeld handig zijn als uw site de parameterwaarde gebruikt om de volgorde te wijzigen waarin inhoud wordt weergegeven die anders identiek zou zijn. Zo bevat
www.example.com/dresses/real.htm?sort=price_highdezelfde inhoud alswww.example.com/dresses/real.htm?sort=price_low. Gebruik deze instelling om Googlebot te laten weten dat alleen de URL's moeten worden gecrawld metsort=price_low. Zo voorkomt u dat inhoud dubbel wordt gecrawld. - Geen URL's. Googlebot crawlt geen URL's met deze parameter. Als u Googlebot bijvoorbeeld laat weten dat URL's met parameters zoals
pricefromenpricetoniet moeten worden gecrawld (zoals inhttp://www.examples.com/search?category=schoen&brand=nike&color=rood&size=37&pricefrom=10&priceto=1000), kunt u voorkomen dat inhoud die al beschikbaar is ophttp://www.examples.com/search?category=schoen&brand=nike&color=rood&size=37, onnodig wordt gecrawld.
Meerdere parameters
Eén URL kan meerdere parameters bevatten en u kunt instellingen opgeven voor elke parameter. Instellingen voor strengere beperkingen krijgen voorrang op instellingen voor minder strenge beperkingen. Hier volgen bijvoorbeeld drie parameters en hun instellingen:
- shopping-category (elke URL)
- sort-by (alleen URL's met waarde = production-year)
- sort-order (alleen URL's met waarde = asc)
Op basis van deze instellingen zou Google de volgende URL crawlen: www.example.com?shopping-category=DVD-movies&sort-by=production-year&sort-order=asc.
Google zou deze URL echter niet crawlen: www.example.com?shopping-category=shoes&sort-by=size&sort-order=asc. Dit komt omdat de instellingen Google laten weten dat alleen die URL's moeten worden gecrawld waarvoor de waarde van de parameter sort-by gelijk is aan production-year. Aangezien schoenen nooit worden gesorteerd op productiejaar, zorgt deze zeer beperkende instelling ervoor dat veel inhoud niet wordt gecrawld.
