Dubbele URL's consolideren

Een canonieke pagina definiëren voor vergelijkbare of dubbele pagina's

Overzicht

Als je één pagina hebt die toegankelijk is via meerdere URL's of verschillende pagina's met vergelijkbare content (bijvoorbeeld een pagina met zowel een mobiele als een desktopversie), ziet Google deze als dubbele versies van dezelfde pagina. Google kiest één URL als de canonieke versie en crawlt die URL. Alle andere URL's worden beschouwd als dubbele URL's en worden minder vaak gecrawld. 

Als je Google niet expliciet laat weten welke URL canoniek is, maakt Google de keuze voor jou of wordt aan elk van de URL's evenveel gewicht toegekend, wat kan leiden tot ongewenst gedrag, zoals hieronder in Waarom moet ik een canonieke URL kiezen? wordt uitgelegd.

Meer informatie
Hier volgt meer informatie over canonieke URL's dan je waarschijnlijk nodig hebt, dus sla dit gedeelte gerust over. We verstrekken de informatie voor het geval je dit soort dingen interessant vindt.
Wanneer Googlebot een site indexeert, probeert deze de onderwerpen te bepalen die op elke pagina worden behandeld. Als Googlebot meerdere pagina's op dezelfde site vindt die ongeveer hetzelfde lijken te zijn, kiest Googlebot de pagina die volgens de bot het meest compleet en nuttig is en wordt deze gemarkeerd als canoniek. De canonieke pagina wordt het vaakst gecrawld. De duplicaten worden minder vaak gecrawld om het crawlbudget op je site te sparen. Als je Googlebot niet laat weten wat de canonieke pagina is en je besluit dat een andere pagina canoniek is, besteed je mogelijk dus energie aan het updaten van een pagina die Googlebot niet vaak zal indexeren of in zoekresultaten zal weergeven.
Google gebruikt de canonieke pagina's op je site als gouden standaard voor de content van je site wat betreft het evalueren van content en kwaliteit. Google-zoekresultaten verwijzen meestal naar de canonieke pagina, tenzij een van de duplicaten expliciet beter geschikt is voor de zoekopdracht van een gebruiker. Het zoekresultaat verwijst bijvoorbeeld waarschijnlijk naar de mobiele pagina als de gebruiker een mobiel apparaat gebruikt, zelfs als de desktoppagina is gemarkeerd als canoniek.
Google kiest de canonieke pagina op basis van een aantal factoren (of signalen), zoals: of de pagina wordt weergegeven via http of https; het door de gebruiker aangegeven voorkeursdomein; de paginakwaliteit; de aanwezigheid van de URL in een sitemap; en eventuele "rel=canonical"-labels. Je kunt Google's keuze voor de canonieke pagina niet afdwingen, maar je kunt de keuze wel beïnvloeden via een of meer van de hier getoonde technieken.

 

Waarom zou ik vergelijkbare/dubbele pagina's hebben?

Er zijn goede redenen waarom je site verschillende URL's kan hebben die naar dezelfde pagina verwijzen of waarom er dubbele of sterk gelijkende pagina's op verschillende URL's staan. Dit zijn de meest voorkomende:

  • Voor gebruik op meerdere apparaattypen:
    https://example.com/news/koala-rampage
    https://m.example.com/news/koala-rampage
    https://amp.example.com/news/koala-rampage
    
  • Voor het gebruik van dynamische URL's voor zaken als zoekparameters of sessie-ID's:
    https://www.example.com/products?category=dresses&color=green
    https://example.com/dresses/cocktail?gclid=ABCD
    https://www.example.com/dresses/green/greendress.html
  • Als je blogsysteem automatisch meerdere URL's opslaat wanneer je dezelfde post in meerdere secties plaatst.
    https://blog.example.com/dresses/green-dresses-are-awesome/
    https://blog.example.com/green-things/green-dresses-are-awesome/
  • Als je server zo is ingesteld dat dezelfde content wordt geleverd voor varianten van http/https met of zonder 'www':
    http://example.com/green-dresses
    https://example.com/green-dresses
    http://www.example.com/green-dresses
    
  • Als content die je op een blog levert voor syndicatie aan andere sites, gedeeltelijk of volledig wordt gereproduceerd op die domeinen:
    https://news.example.com/green-dresses-for-every-day-155672.html (syndicatiepost) https://blog.example.com/dresses/green-dresses-are-awesome/3245/ (oorspronkelijke post)

Waarom moet ik een canonieke URL kiezen?

Er zijn meerdere redenen waarom je expliciet een canonieke pagina in een reeks dubbele/vergelijkbare pagina's zou willen kiezen:

  • Als je wilt aangeven welke URL mensen te zien krijgen in de zoekresultaten. Je geeft er bijvoorbeeld de voorkeur aan dat mensen terechtkomen op je productpagina met groene jurken via https://www.example.com/dresses/green/greendress.html in plaats van https://example.com/dresses/cocktail?gclid=ABCD.
  • Als je linksignalen wilt consolideren voor vergelijkbare of dubbele pagina's. Hierdoor kunnen zoekmachines de informatie die ze voor de afzonderlijke URL's hebben (zoals links naar de URL's), consolideren tot één voorkeurs-URL. Dit betekent dat links van andere sites naar http://example.com/dresses/cocktail?gclid=ABCD worden geconsolideerd met links naar https://www.example.com/dresses/green/greendress.html.
  • Als je statistieken wilt bijhouden voor één product/onderwerp. Met verschillende URL's is het een grotere uitdaging om geconsolideerde statistieken voor bepaalde content te verkrijgen.
  • Als je syndicatiecontent wilt beheren. Als je je content via syndicatie publiceert op andere domeinen, wil je de paginarangschikking consolideren naar je voorkeurs-URL.
  • Als je wilt voorkomen dat crawltijd wordt besteed aan dubbele pagina's. Je wilt natuurlijk dat Googlebot het maximale uit je site haalt, dus is het beter als Googlebot tijd besteedt aan het crawlen van nieuwe (of geüpdatete) pagina's van je site in plaats van aan het crawlen van de desktopversies en mobiele versies van dezelfde pagina's.

Welke URL beschouwt Google als canoniek (of dubbel)?

Gebruik de URL-inspectietool om na te gaan welke pagina Google als canoniek beschouwt. Ook als je expliciet een canonieke pagina opgeeft, kan Google om diverse redenen, zoals prestaties of content, ervoor kiezen een andere canonieke pagina te kiezen.

Een canonieke pagina opgeven

Er zijn verschillende manieren om de canonieke pagina in een dubbele set op te geven, afhankelijk van je gebruik:

Methode Beschrijving
Algemene richtlijnen Volg deze richtlijnen voor alle methoden voor canonieke URL's.
Het voorkeursdomein opgeven

Gebruik Search Console om URL's in het ene domein op te geven als canoniek ten opzichte van hun tegenhangers in een ander domein. Bijvoorbeeld: example.com in plaats van www.example.com. Gebruik dit alleen als je twee vergelijkbare sites hebt die alleen qua subdomein verschillen. Gebruik dit niet voor de tegenhangers met http/https.

Voordelen:

  • Zeer eenvoudig te implementeren, beheren en wijzigen.
  • Gebruik dit als je identieke sites in verschillende domeinen hebt.

Nadelen:

  • Werkt alleen op het detailniveau van het domein. Bovendien moeten de pagina's identieke paden en namen hebben om als duplicaten te worden beschouwd.
  • Voor benoemde pagina's met een identiek pad kun je slechts één toewijzing van pagina naar pagina maken.
De tag rel=canonical <link>

Voeg aan de code van alle dubbele pagina's een <link>-tag toe die verwijst naar de canonieke pagina.

Voordelen:

  • Er is geen limiet aan het aantal dubbele pagina's dat kan worden toegewezen.

Nadelen:

  • Kan ertoe leiden dat de pagina groter wordt.
  • Het kan complex zijn om de toewijzing te beheren op grotere sites of sites waar de URL's vaak veranderen.
  • Werkt alleen voor html-pagina's, niet voor bestanden zoals pdf. In dergelijke gevallen kun je de HTTP-header rel=canonical gebruiken.
De HTTP-header rel=canonical

Verzend een rel=canonical-header in de paginareactie.

Voordelen:

  • De pagina wordt niet groter.
  • Er is geen limiet aan het aantal dubbele pagina's dat kan worden toegewezen.

Nadelen:

  • Het kan complex zijn om de toewijzing te beheren op grotere sites of sites waar de URL's vaak veranderen.
Sitemap

Geef je canonieke pagina's op in een sitemap.

Voordelen:

  • Eenvoudig te doen en te beheren, vooral op grote sites.

Nadelen:

  • Googlebot moet nog steeds het gekoppelde duplicaat bepalen voor canonieke URL's die je in de sitemap aangeeft.
  • Minder krachtig signaal richting Googlebot dan de toewijzingstechniek rel=canonical.
301-omleiding Gebruik 301-omleidingen om Googlebot te laten weten dat een omgeleide URL een betere versie betreft dan een bepaalde URL. Gebruik dit alleen als je een dubbele pagina beëindigt.
AMP-variant Als een van je varianten een AMP-pagina is, moet je de AMP-richtlijnen volgen om de canonieke pagina en de AMP-variant aan te geven.

 

Hoewel we je aanraden een van deze methoden te gebruiken, is geen van de methoden vereist. Als je geen canonieke URL aangeeft, identificeren we de versie of URL die volgens ons het beste is.

Algemene richtlijnen

Volg voor alle methoden voor canonieke URL's de onderstaande algemene richtlijnen.

Algemene richtlijnen
  • Gebruik het robots.txt-bestand niet voor doeleinden met betrekking tot canonieke URL's.
  • Gebruik de tool voor het verwijderen van URL's niet voor canonieke URL's: de tool verwijdert alle versies van een URL uit Google Zoeken.
  • Geef geen verschillende URL's op als canonieke URL voor dezelfde pagina, ongeacht of je dezelfde of een andere techniek voor canonieke URL's gebruikt (geef bijvoorbeeld niet een bepaalde URL op in een sitemap en een andere URL voor dezelfde pagina via rel="canonical").
  • Gebruik noindex niet om te voorkomen dat een canonieke pagina wordt geselecteerd. Deze instructie is bedoeld om de pagina van de index uit te sluiten, niet om de keuze voor een canonieke pagina te beheren. 
  • Geef wel een canonieke pagina op wanneer je hreflang-tags gebruikt. Geef een canonieke pagina op in dezelfde taal (of in de best mogelijke vervangende taal als er voor dezelfde taal geen canonieke pagina bestaat).

De voorkeur geven aan HTTPS boven HTTP voor canonieke URL's

Google geeft de voorkeur aan HTTPS-pagina's boven HTTP-pagina's als canonieke pagina's, behalve wanneer er conflicterende signalen zijn, zoals de volgende:

  • De HTTPS-pagina heeft een ongeldig SSL-certificaat.
  • De HTTPS-pagina bevat onveilige afhankelijkheden (behalve afbeeldingen).
  • De HTTPS-pagina leidt gebruikers om naar of via een HTTP-pagina.
  • De HTTPS-pagina bevat een rel="canonical"-link naar de HTTP-pagina.

Hoewel onze systemen standaard de voorkeur geven aan HTTPS-pagina's boven HTTP-pagina's, kun je een van de volgende acties uitvoeren om ervoor te zorgen dat dit gedrag wordt toegepast:

  • Voeg omleidingen toe vanaf de HTTP-pagina naar de HTTPS-pagina.
  • Een rel="canonical"-link toevoegen van de HTTP-pagina naar de HTTPS-pagina.
  • HSTS implementeren.

Vermijd het volgende om te voorkomen dat Google de HTTP-pagina ten onrechte canoniek maakt:

  • Ongeldige SSL-certificaten en HTTPS-naar-HTTP-omleidingen zorgen ervoor dat we een zeer sterke voorkeur voor HTTP krijgen. Deze sterke voorkeur wordt niet genegeerd als je HSTS implementeert.
  • De HTTP-pagina in plaats van de HTTPS-versie opnemen in je sitemap of hreflang-vermeldingen.
  • Je SSL/TLS-certificaat implementeren voor de verkeerde hostvariant (example.com levert bijvoorbeeld het certificaat voor www.example.com).  Het certificaat moet overeenkomen met je volledige site-URL of moet een certificaat met jokertekens zijn dat kan worden gebruikt voor meerdere subdomeinen binnen een domein.

Laat Google dynamische parameters negeren

Gebruik de functie Parameterbehandeling om Googlebot te laten weten welke parameters moeten worden genegeerd tijdens het crawlen. Wanneer we bepaalde parameters negeren, wordt er minder dubbele content in de index van Google weergegeven en kan je site sneller worden gecrawld. Als je bijvoorbeeld opgeeft dat de parameter sessionid moet worden genegeerd, beschouwt Googlebot de volgende twee URL's als duplicaten:

  • https://www.example.com/dresses/green.php?sessionid=273749
  • https://www.example.com/dresses/green.php

Specifieke methoden

Kies een van de volgende methoden om een canonieke URL op te geven voor dubbele URL's of dubbele/vergelijkbare pagina's.

Zorg ervoor dat je voor alle methoden de bovenstaande algemene richtlijnen volgt.

Een voorkeursdomein instellen

Gebruik Search Console om Google te laten weten aan welke versie van de URL van je site je de voorkeur geeft als canonieke URL voor je domein:

  • https://www.example.com
  • https://example.com

Als je je voorkeursdomein instelt als https://example.com, behandelt Google vergelijkbare URL's of pagina's op www.example.com als duplicaten van pagina's op example.com.

Lees Je voorkeursdomein instellen voor meer informatie.

De link-tag rel="canonical"

Je kunt een <link>-tag in de paginaheader gebruiken om aan te geven wanneer een pagina een duplicaat is van een andere pagina.

Stel dat je wilt dat https://example.com/dresses/green-dresses de canonieke URL is, ook al hebben meerdere URL's toegang tot deze content. Volg dan de volgende stappen om deze URL als canoniek aan te duiden:

  1. Markeer alle dubbele pagina's met een linkelement rel="canonical". Voeg aan het <head>-gedeelte van dubbele pagina's een <link>-element met het kenmerk rel="canonical" toe dat verwijst naar de canonieke pagina, bijvoorbeeld:
    <link rel="canonical" href="https://example.com/dresses/green-dresses" />

  2. Als de canonieke pagina een mobiele variant heeft, voeg je er een rel="alternate"-link aan toe die verwijst naar de mobiele versie van de pagina:
    <link rel="alternate" media="only screen and (max-width: 640px)"  href="http://m.example.com/dresses/green-dresses">

  3. Voeg hreflang of andere omleidingen toe die geschikt zijn voor de pagina.

Gebruik absolute paden in plaats van relatieve paden met het linkelement rel="canonical".

Gebruik deze structuur:  https://www.example.com/dresses/green/greendresss.html
Niet deze structuur: /dresses/green/greendress.html
Gebruik de HTTP-header rel="canonical"

Als je je server kunt configureren, kun je HTTP-headers van het type rel="canonical" gebruiken (in plaats van html-tags) om de canonieke URL aan te geven voor niet-html-documenten zoals pdf-bestanden.

Als je bijvoorbeeld een pdf-bestand via meerdere URL's bereikbaar maakt, kun je voor de dubbele URL's een HTTP-header rel="canonical" zoals het onderstaande voorbeeld retourneren om Googlebot te laten weten wat de canonieke URL voor het pdf-bestand is:

Link: <http://www.example.com/downloads/white-paper.pdf>; rel="canonical"

Google ondersteunt deze methode momenteel alleen voor online zoekopdrachten.

Gebruik absolute paden in plaats van relatieve paden met het linkelement rel="canonical". Dat wil zeggen:
Gebruik deze structuur: http://www.example.com/downloads/white-paper.pdf
Niet deze structuur: /downloads/white-paper.pdf
Gebruik een sitemap

Kies voor elke pagina een canonieke URL en neem deze op in een sitemap. Alle pagina's in een sitemap worden voorgesteld als canonieke pagina's; Googlebot bepaalt op basis van vergelijkbare content welke pagina's dubbel zijn (indien van toepassing).

We kunnen niet garanderen dat de sitemap-URL's als canoniek worden beschouwd, maar het is een eenvoudige manier om canonieke pagina's te definiëren voor een grote site. Sitemaps zijn een handige manier om Google te laten weten welke pagina's je het belangrijkst vindt op je site.

Neem geen niet-canonieke pagina's op in een sitemap. Als je een sitemap gebruikt, geef je alleen canonieke URL's op in de sitemap.

Gebruik 301-omleidingen voor URL's die niet meer worden gebruikt

Gebruik deze methode als je de bestaande dubbele pagina's wilt verwijderen, maar wilt zorgen voor een soepele overgang voordat je stopt met het gebruik van de oude URL's.

Stel dat je pagina op meerdere manieren kan worden bereikt:

  • https://example.com/home
  • https://home.example.com
  • https://www.example.com

Kies een van die URL's als je canonieke URL en gebruik 301-omleidingen om verkeer van andere URL's door te sturen naar je voorkeurs-URL. Een 301-omleiding aan de serverzijde is de beste manier om ervoor te zorgen dat gebruikers en zoekmachines naar de juiste pagina worden geleid. De statuscode 301 betekent dat een pagina permanent is verplaatst naar een nieuwe locatie.

Als je een service voor het hosten van websites gebruikt, zoek je in hun documentatie naar informatie over het instellen van 301-omleidingen.

Was dit artikel nuttig?
Hoe kunnen we dit verbeteren?