URL-parameters

Google probeert uw site zo efficiënt mogelijk te crawlen. Het crawlen en indexeren van pagina's met identieke inhoud is immers inefficiënt voor ons. Dit inefficiënte gebruik van middelen zou het aantal pagina's kunnen beperken dat we op uw site kunnen crawlen, en dubbele inhoud in onze index kan bovendien een negatief effect hebben op de prestaties van uw pagina's in onze zoekresultaten. Dubbele inhoud komt vaak voor wanneer sites dezelfde inhoud beschikbaar stellen via verschillende URL's, bijvoorbeeld door sessie-id's of andere parameters te gebruiken, zoals hier:

http://www.example.com/producten/vrouwen/jurken/groen.htm
http://www.example.com/producten/vrouwen?category=jurken&color=groen
http://example.com/winkel/index.php?product_id=32&highlight=groen+jurk&cat_id=1&sessionid=123&affid=431

In dit geval verwijzen al deze URL's naar dezelfde inhoud: een collectie groene jurken.

Wanneer Google dubbele inhoud detecteert, zoals varianten met verschillende URL-parameters, groeperen we de dubbele URL's in één cluster en selecteren we wat we de 'beste' URL vinden om deze cluster in zoekresultaten te vertegenwoordigen. We voegen de eigenschappen van de URL's in de cluster, zoals de linkpopulariteit, toe aan de representatieve URL. Door eigenschappen van URL's samen te voegen tot één representatieve URL, kunnen we gebruikers vaak nauwkeurigere zoekresultaten bieden.

We raden u aan de tool voor parameterbehandeling te gebruiken om Google te laten weten hoe URL's met specifieke parameters moeten worden behandeld, zodat u het indexeringsproces van uw site kunt verbeteren. We proberen rekening te houden met deze informatie, maar er kunnen gevallen voorkomen waarin de voorgestelde suggesties meer kwaad dan goed doen.

Het configureren van parameters voor de hele site kan ernstige en onbedoelde gevolgen hebben voor de manier waarop Google uw pagina's crawlt en indexeert. Stel dat een e-commercesite storeID gebruikt in de winkelzoeker en om de beschikbaarheid van een product in een winkel te controleren:
/store-locator?storeID=123
/product/foo-widget?storeID=123
Als u storeID configureert zodat deze niet wordt gecrawld, is dit van invloed op de paden /store-locator en /foo-widget. Als gevolg hiervan kan Google beide soorten URL's niet indexeren en kunnen ze niet worden weergegeven in onze zoekresultaten. Als deze parameters worden gebruikt voor verschillende doeleinden, raden we u aan verschillende parameternamen te gebruiken.

In het algemeen vallen URL-parameters in een van twee categorieën:

  • Parameters die de pagina-inhoud niet veranderen: bijvoorbeeld sessionid, affiliateid. Parameters zoals deze worden vaak gebruikt om bezoeken en verwijzingen bij te houden. Ze hebben geen effect op de daadwerkelijke inhoud van de pagina. Zo verwijzen de volgende URL's allemaal naar precies dezelfde inhoud:
          http://www.example.com/producten/dames/jurken?sessionid=12345
          http://www.example.com/producten/dames/jurken?sessionid=34567
          http://www.example.com/producten/dames/jurken?sessionid=34567&source=google.com
        
  • Parameters die de inhoud van een pagina veranderen of bepalen: bijvoorbeeld brand, gender, country, sortorder. Zo kan een parameter het volgende effect hebben op pagina-inhoud:
    • Sorteren (bijvoorbeeld sort=price_ascending): hiermee wordt de volgorde aangepast waarin de inhoud wordt gepresenteerd.
    • Verfijnen (bijvoorbeeld t-shirt_size=XS): hiermee wordt de inhoud op de pagina gefilterd.
    • Specificeren (bijvoorbeeld store=women): hiermee wordt bepaald welke inhoudsset op een pagina wordt weergegeven.
    • Vertalen (bijvoorbeeld lang=fr): hiermee wordt een vertaalde versie van de inhoud weergegeven.
    • Pagineren (bijvoorbeeld page=2): hiermee wordt een specifieke pagina uit een langere vermelding of artikel weergegeven.
    • Anders: hiermee wordt inhoud op andere dan de hierboven beschreven manieren gewijzigd.

We raden u aan de tool voor URL-parameters te gebruiken om Google te laten weten wat het doel is van de parameters die u op uw site gebruikt en hoe URL's met deze parameters moeten worden verwerkt.

Opgeven hoe Google parameters moet behandelen:

  1. Klik op het Dashboard bij Crawlen op URL-parameters.
  2. Klik naast de betreffende parameter op Bewerken. (Als de parameter niet wordt vermeld, klikt u op Parameter toevoegen. Deze tool is hoofdlettergevoelig, dus zorg ervoor dat u de parameter precies zo invoert als deze in uw URL wordt weergegeven.)
  3. Als de parameter geen effect heeft op de inhoud die aan de gebruiker wordt weergegeven, selecteert u Nee... in de lijst Heeft deze parameter effect... en klik op Opslaan. Als de parameter wel effect heeft op de manier waarop inhoud wordt weergegeven, klikt u op Ja: de parameter wijzigt, reorganiseert of verfijnt de pagina-inhoud en selecteert u vervolgens hoe Google URL's met deze parameter moet crawlen.
    • Laat Googlebot beslissen. Selecteer deze optie als u niet zeker weet wat de parameter doet of als het gedrag verschillend is voor verschillende delen van de site. Googlebot analyseert uw site om te bepalen hoe de parameter het best kan worden behandeld. Dit is een goede algemene optie.
    • Elke URL. Googlebot gebruikt de waarde van deze parameter om te bepalen of een URL uniek is. Zo wordt www.example.com/jurken/real.htm?productid=1202938 als een volledig andere URL beschouwd dan www.example.com/jurken/real.htm?productid=5853729. Controleer voordat u deze optie selecteert of de parameter inderdaad effect heeft op de pagina-inhoud; anders crawlt Google mogelijk onnodig dubbele inhoud op uw site.
    • Alleen URL's met waarde=x. Googlebot crawlt alleen de URL's waarvan de waarde van de parameter overeenkomt met deze gespecificeerde waarde. URL's met een andere parameterwaarde worden niet gecrawld. Dit kan bijvoorbeeld handig zijn als uw site de parameterwaarde gebruikt om de volgorde te wijzigen waarin inhoud wordt weergegeven die anders identiek zou zijn. Zo bevat www.example.com/jurken/real.htm?sort=price_high dezelfde inhoud als www.example.com/jurken/real.htm?sort=price_low. Gebruik deze instelling om Googlebot te laten weten dat alleen de URL's met sort=price_low moeten worden gecrawld. Zo voorkomt u dat inhoud dubbel wordt gecrawld.
    • Geen URL's. Googlebot crawlt geen URL's met deze parameter. Als u Googlebot bijvoorbeeld laat weten dat URL's met parameters zoals pricefrom en priceto (zoals http://www.examples.com/search?category=shoe&brand=nike&color=red&size=5&pricefrom=10&priceto=1000) niet moeten worden gecrawld, kunt u het overbodig crawlen voorkomen van inhoud die al beschikbaar is via http://www.examples.com/search?category=shoe&brand=nike&color=red&size=5.

Meerdere parameters

Eén URL kan meerdere parameters bevatten en u kunt instellingen opgeven voor elke parameter. Instellingen voor strengere beperkingen krijgen voorrang op instellingen voor minder strenge beperkingen. Hier volgen bijvoorbeeld drie parameters en hun instellingen:

  • shopping-category (elke URL)
  • sort-by (alleen URL's met waarde = production-year)
  • sort-order (alleen URL's met waarde = asc)

Op basis van deze instellingen zou Google de volgende URL crawlen: www.example.com?shopping-category=DVD-movies&sort-by=production-year&sort-order=asc.

Google zou deze URL echter niet crawlen: www.example.com?shopping-category=shoes&sort-by=size&sort-order=asc. Dit komt omdat de instellingen Google laten weten dat alleen die URL's moeten worden gecrawld waarvoor de waarde van de parameter sort-by gelijk is aan production-year. Aangezien schoenen nooit worden gesorteerd op productiejaar, zorgt deze zeer beperkende instelling ervoor dat veel inhoud niet wordt gecrawld.


Als uw site inhoud publiceert die via meerdere URL's kan worden bereikt, kunt u meer controle krijgen over hoe uw URL's worden weergegeven in zoekresultaten door een canonieke versie (voorkeursversie) van de URL te specificeren. U kunt dit onder andere doen door de tool voor parameterbehandeling te gebruiken, maar u kunt Google ook extra informatie bieden door het element rel="canonical" aan de HTML-bron van uw voorkeurs-URL toe te voegen. (Als u rel="canonical"wilt gebruiken, moet u de broncode van uw pagina's kunnen bewerken.) Meer informatie over canonieke URL's. Gebruik de optie die het meest geschikt is voor uw situatie. U kunt ook beide opties gebruiken als u dit zorgvuldig wilt instellen.