Dubbele URL's consolideren
Overzicht
Als u één pagina heeft die toegankelijk is via meerdere URL's of verschillende pagina's met vergelijkbare content (bijvoorbeeld een pagina met zowel een mobiele versie als een desktopversie), moet u Google expliciet laten weten welke URL de belangrijkste is (oftewel canoniek is) voor die pagina. Als u dit niet expliciet doet, maakt Google de keuze voor u of wordt aan elk van de URL's evenveel gewicht toegekend, wat kan leiden tot ongewenst gedrag, zoals wordt uitgelegd in het volgende gedeelte.
Hoewel we u aanbevelen een canonieke pagina op te geven voor dubbele URL's of versies, kan Google om diverse redenen, zoals prestaties of content, op algoritmische wijze een andere pagina kiezen dan de canonieke pagina.
Waarom zou ik vergelijkbare/dubbele pagina's hebben?
Er zijn goede redenen waarom uw site verschillende URL's kan hebben die naar dezelfde pagina verwijzen of waarom er dubbele of sterk gelijkende pagina's op verschillende URL's staan. Dit zijn de meest voorkomende:
- Voor gebruik op meerdere apparaattypen:
https://example.com/news/koala-rampage https://m.example.com/news/koala-rampage https://amp.example.com/news/koala-rampage
- Voor het gebruik van dynamische URL's voor zaken als zoekparameters of sessie-ID's:
https://www.example.com/products?category=dresses&color=green https://example.com/dresses/cocktail?gclid=ABCD https://www.example.com/dresses/green/greendress.html
- Als uw blogsysteem automatisch meerdere URL's opslaat wanneer u dezelfde post in meerdere secties plaatst.
https://blog.example.com/dresses/green-dresses-are-awesome/ https://blog.example.com/green-things/green-dresses-are-awesome/
- Als uw server zo is ingesteld dat dezelfde content wordt geleverd voor varianten van http/https met of zonder 'www':
http://example.com/green-dresses https://example.com/green-dresses http://www.example.com/green-dresses
- Als content die u op een blog levert voor syndicatie aan andere sites, gedeeltelijk of volledig wordt gereproduceerd op die domeinen:
https://news.example.com/green-dresses-for-every-day-155672.html
(syndicatiepost)https://blog.example.com/dresses/green-dresses-are-awesome/3245/
(oorspronkelijke post)
Waarom het uitmaakt
Er zijn meerdere redenen waarom u expliciet een canonieke pagina in een reeks dubbele/vergelijkbare pagina's zou willen kiezen:
- Als u wilt aangeven welke URL mensen te zien krijgen in de zoekresultaten. U geeft er bijvoorbeeld de voorkeur aan dat mensen terechtkomen op uw productpagina met groene jurken via
https://www.example.com/dresses/green/greendress.html
in plaats vanhttps://example.com/dresses/cocktail?gclid=ABCD
. - Als u linksignalen wilt consolideren voor vergelijkbare of dubbele pagina's. Hierdoor kunnen zoekmachines de informatie die ze voor de afzonderlijke URL's hebben (zoals links naar de URL's), consolideren tot één voorkeurs-URL. Dit betekent dat links van andere sites naar
http://example.com/dresses/cocktail?gclid=ABCD
worden geconsolideerd met links naarhttps://www.example.com/dresses/green/greendress.html
. - Als u statistieken wilt bijhouden voor één product/onderwerp. Met verschillende URL's is het een grotere uitdaging om geconsolideerde statistieken voor bepaalde content te verkrijgen.
- Als u syndicatie-inhoud wilt beheren. Als u uw content via syndicatie publiceert op andere domeinen, wilt u de paginarangschikking consolideren naar uw voorkeurs-URL.
- Als u wilt voorkomen dat crawltijd wordt besteed aan dubbele pagina's. U wilt natuurlijk dat Googlebot het maximale uit uw site haalt, dus is het beter als Googlebot tijd besteedt aan het crawlen van nieuwe (of geüpdatete) pagina's van uw site in plaats van aan het crawlen van de desktopversies en mobiele versies van dezelfde pagina's.
Welke URL beschouwt Google als canoniek (of dubbel)?
Gebruik het rapport Indexeringsstatus om te bepalen welke URL's canoniek of dubbel zijn. Duplicaten worden gemarkeerd als uitgesloten. Canonieke pagina's worden gemarkeerd als geldig.
Zoek naar geldige URL's met de markering 'Geïndexeerd, overweeg om te markeren als canoniek' om te zien welke pagina's u expliciet moet overwegen om als canoniek te markeren.
Zoek naar uitgesloten URL's met de markering 'Google heeft een andere canonieke pagina gekozen dan de gebruiker' om te zien waar u en Google verschillende canonieke pagina's in een set hebben gekozen.
Een canonieke pagina opgeven
Er zijn verschillende manieren om de canonieke pagina in een dubbele set op te geven, afhankelijk van uw gebruik:
Methode | Beschrijving |
---|---|
Algemene richtlijnen | Volg deze richtlijnen voor alle methoden voor canonieke URL's. |
Het voorkeursdomein opgeven |
Gebruik Search Console om URL's in het ene domein op te geven als canoniek ten opzichte van hun tegenhangers in een ander domein. Bijvoorbeeld: example.com in plaats van www.example.com. Gebruik dit alleen als u twee vergelijkbare sites heeft die alleen qua subdomein verschillen. Gebruik dit niet voor de tegenhangers met http/https. Voordelen:
Nadelen:
|
De tag rel=canonical <link> |
Voeg aan de code van alle dubbele pagina's een <link>-tag toe die verwijst naar de canonieke pagina. Voordelen:
Nadelen:
|
De HTTP-header rel=canonical |
Verzend een rel=canonical-header in de paginareactie. Voordelen:
Nadelen:
|
Sitemap |
Geef uw canonieke pagina's op in een sitemap. Voordelen:
Nadelen:
|
301-omleiding | Gebruik 301-omleidingen om Googlebot te laten weten dat een omgeleide URL een betere versie betreft dan een bepaalde URL. Gebruik dit alleen als u een dubbele pagina beëindigt. |
AMP-variant | Als een van uw varianten een AMP-pagina is, moet u de AMP-richtlijnen volgen om de canonieke pagina en de AMP-variant aan te geven. |
Hoewel we u aanraden een van deze methoden te gebruiken, is geen van de methoden vereist. Als u geen canonieke URL aangeeft, identificeren we de versie of URL die volgens ons het beste is.
Algemene richtlijnen
Volg voor alle methoden voor canonieke URL's de onderstaande algemene richtlijnen.
- Gebruik het robots.txt-bestand
niet
voor doeleinden met betrekking tot canonieke URL's. - Gebruik de tool voor het verwijderen van URL's niet voor canonieke URL's: de tool verwijdert alle versies van een URL uit Google Zoeken.
- Geef geen verschillende URL's op als canonieke URL voor dezelfde pagina, ongeacht of u dezelfde of een andere techniek voor canonieke URL's gebruikt (geef bijvoorbeeld niet een bepaalde URL op in een sitemap en een andere URL voor dezelfde pagina via
rel="canonical")
. - Gebruik noindex niet om te voorkomen dat een canonieke pagina wordt geselecteerd. Deze instructie is bedoeld om de pagina van de index uit te sluiten, niet om de keuze voor een canonieke pagina te beheren.
-
Geef wel een canonieke pagina op wanneer u hreflang-tags gebruikt. Geef een canonieke pagina op in dezelfde taal (of in de best mogelijke vervangende taal als er voor dezelfde taal geen canonieke pagina bestaat).
De voorkeur geven aan HTTPS boven HTTP voor canonieke URL's
Google geeft de voorkeur aan HTTPS-pagina's boven HTTP-pagina's als canonieke pagina's, behalve wanneer er conflicterende signalen zijn, zoals de volgende:
- De HTTPS-pagina heeft een ongeldig SSL-certificaat.
- De HTTPS-pagina bevat onveilige afhankelijkheden (behalve afbeeldingen).
- De HTTPS-pagina leidt gebruikers om naar of via een HTTP-pagina.
- De HTTPS-pagina bevat een
rel="canonical"
-link naar de HTTP-pagina.
Hoewel onze systemen standaard de voorkeur geven aan HTTPS-pagina's boven HTTP-pagina's, kunt u een van de volgende acties uitvoeren om ervoor te zorgen dat dit gedrag wordt toegepast:
- Voeg omleidingen toe vanaf de HTTP-pagina naar de HTTPS-pagina.
- Een
rel="canonical"
-link toevoegen van de HTTP-pagina naar de HTTPS-pagina. - HSTS implementeren.
Vermijd het volgende om te voorkomen dat Google de HTTP-pagina ten onrechte canoniek maakt:
- Ongeldige SSL-certificaten en HTTPS-naar-HTTP-omleidingen zorgen ervoor dat we een zeer sterke voorkeur voor HTTP krijgen. Deze sterke voorkeur wordt niet genegeerd als u HSTS implementeert.
- De HTTP-pagina in plaats van de HTTPS-versie opnemen in uw sitemap of hreflang-vermeldingen.
- Uw SSL/TLS-certificaat implementeren voor de verkeerde hostvariant (example.com levert bijvoorbeeld het certificaat voor www.example.com). Het certificaat moet overeenkomen met uw volledige site-URL of moet een certificaat met jokertekens zijn dat kan worden gebruikt voor meerdere subdomeinen binnen een domein.
Laat Google dynamische parameters negeren
Gebruik de functie Parameterbehandeling om Googlebot te laten weten welke parameters moeten worden genegeerd tijdens het crawlen. Wanneer we bepaalde parameters negeren, wordt er minder dubbele content in de index van Google weergegeven en kan uw site sneller worden gecrawld. Als u bijvoorbeeld opgeeft dat de parameter sessionid
moet worden genegeerd, beschouwt Googlebot de volgende twee URL's als duplicaten:
https://www.example.com/dresses/green.php?sessionid=273749
https://www.example.com/dresses/green.php
Specifieke methoden
Kies een van de volgende methoden om een canonieke URL op te geven voor dubbele URL's of dubbele/vergelijkbare pagina's.
Zorg ervoor dat u voor alle methoden de bovenstaande algemene richtlijnen volgt.
Gebruik Search Console om Google te laten weten aan welke versie van de URL van uw site u de voorkeur geeft als canonieke URL voor uw domein:
https://www.example.com
https://example.com
Als u uw voorkeursdomein instelt als https://example.com
, behandelt Google vergelijkbare URL's of pagina's op www.example.com
als duplicaten van pagina's op example.com
.
Lees Uw voorkeursdomein instellen voor meer informatie.
U kunt een <link>-tag in de paginaheader gebruiken om aan te geven wanneer een pagina een duplicaat is van een andere pagina.
Stel dat u wilt dat https://example.com/dresses/green-dresses
de canonieke URL is, ook al hebben meerdere URL's toegang tot deze content. Volg dan de volgende stappen om deze URL als canoniek aan te duiden:
-
Markeer alle dubbele pagina's met een linkelement rel="canonical". Voeg aan het
<head>
-gedeelte van dubbele pagina's een<link>
-element met het kenmerkrel="canonical"
toe dat verwijst naar de canonieke pagina, bijvoorbeeld:
<link rel="canonical" href="https://example.com/dresses/green-dresses" />
-
Als de canonieke pagina een mobiele variant heeft, voegt u er een
rel="alternate"
-link aan toe die verwijst naar de mobiele versie van de pagina:
<link rel="alternate" media="only screen and (max-width: 640px)" href="http://m.example.com/dresses/green-dresses">
-
Voeg hreflang of andere omleidingen toe die geschikt zijn voor de pagina.
rel="canonical"
.Gebruik deze structuur:
https://www.example.com/dresses/green/greendresss.html
Niet deze structuur:
/dresses/green/greendress.html
Als u uw server kunt configureren, kunt u HTTP-headers van het type rel="canonical"
gebruiken (in plaats van HTML-tags) om de canonieke URL aan te geven voor niet-HTML-documenten zoals pdf-bestanden.
Als u bijvoorbeeld een pdf-bestand via meerdere URL's bereikbaar maakt, kunt u voor de dubbele URL's een HTTP-header rel="canonical"
zoals het onderstaande voorbeeld retourneren om Googlebot te laten weten wat de canonieke URL voor het pdf-bestand is:
Link: <http://www.example.com/downloads/white-paper.pdf>; rel="canonical"
Google ondersteunt deze methode momenteel alleen voor online zoekopdrachten.
rel="canonical"
. Dat wil zeggen:Gebruik deze structuur:
http://www.example.com/downloads/white-paper.pdf
Niet deze structuur:
/downloads/white-paper.pdf
Kies voor elke pagina een canonieke URL en neem deze op in een sitemap. Alle pagina's in een sitemap worden voorgesteld als canonieke pagina's; Googlebot bepaalt op basis van vergelijkbare content welke pagina's dubbel zijn (indien van toepassing).
We kunnen niet garanderen dat de sitemap-URL's als canoniek worden beschouwd, maar het is een eenvoudige manier om canonieke pagina's te definiëren voor een grote site. Sitemaps zijn een handige manier om Google te laten weten welke pagina's u het belangrijkst vindt op uw site.
Neem geen niet-canonieke pagina's op in een sitemap. Als u een sitemap gebruikt, geeft u alleen canonieke URL's op in de sitemap.
Gebruik deze methode als u de bestaande dubbele pagina's wilt verwijderen, maar wilt zorgen voor een soepele overgang voordat u stopt met het gebruik van de oude URL's.
Stel dat uw pagina op meerdere manieren kan worden bereikt:
https://example.com/home
https://home.example.com
https://www.example.com
Kies een van die URL's als uw canonieke URL en gebruik 301-omleidingen om verkeer van andere URL's door te sturen naar uw voorkeurs-URL. Een 301-omleiding aan de serverzijde is de beste manier om ervoor te zorgen dat gebruikers en zoekmachines naar de juiste pagina worden geleid. De statuscode 301 betekent dat een pagina permanent is verplaatst naar een nieuwe locatie.