Slå samman webbadressdubbletter

Definiera en kanonisk sida för nästan likadana sidor eller dubblettsidor

Översikt

Om du har en sida som går att nå via flera webbadresser, eller flera sidor som har nästan samma innehåll (till exempel en mobilversion och en datorversion av samma sida), ska du visa tydligt för Google vilken av webbadresserna som är den primära (kanoniska) för den sidan. Om du inte redovisar detta i klartext väljer Google en av sidorna åt dig eller uppfattar båda som lika viktiga. Detta kan få oönskade konsekvenser, se nedan.

Observera att även om vi rekommenderar att du anger en kanonisk sida för dubblettadresser och dubblettversioner kan Googles algoritmer välja en annan sida som kanonisk av olika skäl, till exempel utifrån prestanda eller innehåll.

Varför skulle jag vilja ha nästan likadana sidor eller dubbletter?

Man kan vilja ha flera webbadresser som går till en och samma sida på en webbplats, eller sidor som är dubbletter eller nästan dubbletter men har olika webbadress, av goda skäl. Det här är de vanligaste:

  • Så att webbplatsen har stöd för flera enhetstyper:
    https://example.com/news/koala-rampage
    https://m.example.com/news/koala-rampage
    https://amp.example.com/news/koala-rampage
    
  • Om man vill ha dynamiska webbadresser för saker som sessions-id:n eller sökparametrar:
    https://www.example.com/products?category=dresses&color=green
    https://example.com/dresses/cocktail?gclid=ABCD
    https://www.example.com/dresses/green/greendress.html
  • Om bloggsystemet du använder automatiskt sparar flera webbadresser när ett inlägg läggs in under flera olika avsnitt:
    https://blog.example.com/dresses/green-dresses-are-awesome/
    https://blog.example.com/green-things/green-dresses-are-awesome/
  • Om servern har konfigurerats att visa samma innehåll för varianter med och utan www i adressen, eller med både http och https:
    http://example.com/green-dresses
    https://example.com/green-dresses
    http://www.example.com/green-dresses
    
  • Om innehåll som du har lagt till på en blogg för syndikering med andra webbplatser replikeras helt eller delvis på de domänerna:
    https://news.example.com/green-dresses-for-every-day-155672.html (syndikerat inlägg) https://blog.example.com/dresses/green-dresses-are-awesome/3245/ (ursprungligt inlägg)
Närmare information
Det här kan vara mer än du vill veta om kanonisering, så du kan hoppa över det här avsnittet om du vill. Vi tar med det ifall du skulle vara intresserad av ämnet.
När Googlebot indexerar en webbplats försöker sökroboten avgöra vad de olika sidorna handlar om. Om flera sidor på webbplatsen ser ut att handla om samma sak väljer Googlebot ut den sida som framstår som mest fullständig och användbar och markerar den som kanonisk. Den kanoniska sidan genomsöks oftare, medan dubblettsidorna genomsöks mindre ofta så att genomsökningarna av webbplatsen inte ska bli för krävande. Om du inte har talat om för Googlebot vilken sida som är den kanoniska och bestämmer att en annan sida ska vara kanonisk kan du alltså slösa tid på att uppdatera en sida som inte indexeras särskilt ofta av Googlebot och som inte visas i sökresultaten.
Google använder de kanoniska sidorna som mått på webbplatsens standard vad gäller innehåll och kvalitet. Googles sökresultat leder också normalt till den kanoniska sidan, om inte en dubblettsida uttryckligen är bättre lämpad utifrån användarens sökfråga. Till exempel länkar sökresultatet antagligen till mobilsidan om användaren söker på en mobil, även om sidan för datorer är den kanoniska.
Google väljer vilken sida som är kanonisk utifrån ett antal faktorer (eller signaler), till exempel om sidan visas via http eller https, vilken domän användaren föredrar, sidans kvalitet, om webbadressen står med i en webbplatskarta och om uppmärkningen rel=canonical används. Du kan inte tvinga Google att välja en viss sida som kanonisk, men du kan påverka valet med hjälp av de tekniker som beskrivs här.

Varför det spelar roll

Det är bra att uttryckligen välja en sida i en uppsättning med dubbletter eller snarlika sidor som kanonisk av flera anledningar:

  • Ange vilken webbadress du vill att folk ska se i sökresultaten. Du kanske föredrar om besökarna kommer till produktsidan om gröna klänningar via https://www.example.com/dresses/green/greendress.html i stället för via https://example.com/dresses/cocktail?gclid=ABCD.
  • Samla länksignaler om snarlika sidor eller dubbletter. Sökmotorerna har nytta av att kunna slå samman uppgifter de har om enskilda webbadresser (t.ex. länkar till dem) till en enda, önskad webbadress. Det gör att länkar från andra webbplatser till http://example.com/dresses/cocktail?gclid=ABCD slås ihop med länkar till https://www.example.com/dresses/green/greendress.html.
  • Förenkla spårningsstatistiken för enskilda produkter/ämnen. Med flera olika webbadresser är det svårare att sammanföra statistik för en viss typ av innehåll.
  • Hantera syndikerat innehåll. Om du syndikerar innehåll så att det publiceras på andra domäner vill du förmodligen att sidrankningen ska slås ihop under den önskade webbadressen.
  • Undvik att genomsökningstid slösas bort på dubblettsidor. Du har större nytta av Googlebot om genomsökningstiden läggs på nya (eller uppdaterade) sidor på webbplatsen än om flera versioner av samma sidor genomsöks, till exempel både datorversionerna och mobilversionerna.

Vilken webbadress ser Google som kanonisk (eller en dubblett)?

I rapporten om indexeringsstatus ser du vilka webbadresser som ses som kanoniska respektive dubbletter. Dubblettsidorna markeras som utelämnade medan kanoniska sidor markeras som giltiga.

Titta efter giltiga webbadresser med statusen Indexerad, markera den gärna som kanonisk. Det hjälper dig identifiera sidor som kan vara lämpliga att markera som kanoniska.

Du kan också titta efter uteslutna webbadresser med statusen Google har valt en annan kanonisk sida än användaren. Det är sidor där du och Google har valt olika sidor som kanoniska.

Ange en sida som kanonisk

Du kan ange vilken av sidorna i en uppsättning med dubbletter som är den kanoniska på flera sätt, beroende på hur du brukar skriva dina webbsidor.

Metod Beskrivning
Allmänna riktlinjer Följ de här riktlinjerna oavsett kanoniseringsmetod.
Ange önskad domän

Med Search Console kan du ange webbadresser på en domän som kanoniska framför motsvarande adresser på andra domäner. Ett exempel kan vara att välja example.com framför www.example.com. Använd bara den här metoden om du har två snarlika webbplatser där enbart underdomänen skiljer. Använd den inte för webbplatser som använder http respektive https.

Fördelar:

  • Mycket enkel att implementera, hantera och ändra
  • Används om du har identiska webbplatser på olika domäner.

Nackdelar:

  • Fungerar bara på domännivå, och sidorna måste ha exakt samma sökvägar och namn om de ska ses som dubbletter.
  • Det går bara att mappa till en enda sida med samma sökväg och namn.
Taggen <link> med attributet rel=canonical

Lägg till taggen <link> med en referens till den kanoniska sidan i koden på alla dubblettsidor.

Fördelar:

  • Hur många dubblettsidor som helst kan mappas.

Nackdelar:

  • Sidstorleken kan öka.
  • Det kan vara besvärligt att underhålla mappningen på större webbplatser eller sådana där webbadresserna ofta ändras.
  • Fungerar bara för HTML-sidor, inte för PDF och liknande filer. För sådana kan du använda rel=canonical i HTTP-huvudet.
rel=canonical i HTTP-huvudet

Skicka rel=canonical i huvudet när servern svarar på sidanrop.

Fördelar:

  • Sidstorleken påverkas inte.
  • Hur många dubblettsidor som helst kan mappas.

Nackdelar:

  • Det kan vara besvärligt att underhålla mappningen på större webbplatser eller sådana där webbadresserna ofta ändras.
Webbplatskarta

Ange de kanoniska sidorna i en webbplatskarta.

Fördelar:

  • Enkelt att göra och underhålla, särskilt på stora webbplatser.

Nackdelar:

  • Googlebot måste fortfarande avgöra vilka sidor som är dubbletter till de kanoniska sidorna som deklarerats i webbplatskartan.
  • Ger en svagare signal till Googlebot än tekniken med rel=canonical.
301-omdirigering Med 301-omdirigeringar kan du tala om för Googlebot att webbadressen som användaren omdirigeras till är en bättre version än en viss webbadress. Använd bara detta när du fasar ut en dubblettsida.
AMP-variant Om en av varianterna är en AMP-sida måste du identifiera den kanoniska sidan och AMP-varianten enligt AMP-riktlinjerna.

 

Vi rekommenderar att du använder någon av dessa metoder, men det är inget krav. Om du inte anger en kanonisk webbadress identifierar vi en version eller webbadress som vi tror är mest lämplig.

Allmänna riktlinjer

Följ de här allmänna riktlinjerna oavsett vilken kanoniseringsmetod du använder.

Allmänna riktlinjer
  • Använd inte filen robots.txt för att ange kanoniska webbadresser.
  • Använd inte borttagningsverktyget för webbadresser för kanonisering. Med det tas alla versioner av en webbadress bort från sökningen.
  • Ange inte olika webbadresser som kanoniska för samma sida, vare sig det görs med samma metod eller med olika metoder (till exempel ska du inte ange en webbadress i en webbplatskarta och en annan webbadress för samma sida med rel="canonical").
  • Använd inte noindex som ett sätt att förhindra att en sida väljs som kanonisk. Det direktivet ska användas för sidor som inte ska indexeras, inte för att hantera valet av kanonisk sida. 
  • Ange en kanonisk sida om du använder hreflang-taggar. Ange en kanonisk sida på samma språk eller bästa möjliga ersättning om den kanoniska sidan inte finns på det språket.

Använd hellre HTTPS än HTTP i kanoniska webbadresser

Google ser hellre att HTTPS-sidor används som kanoniska än motsvarande sidor med HTTP, utom när det finns problem eller motstridiga signaler som i följande fall:

  • HTTPS-sidan har ett ogiltigt SSL-certifikat
  • HTTPS-sidan är beroende av osäkra resurser (utom bilder)
  • Användarna omdirigeras från HTTPS-sidan till eller via en HTTP-sida
  • HTTPS-sidan har en länk till HTTP-sidan med rel="canonical"

Även om våra system väljer HTTPS-sidor framför HTTP-sidor som standard kan du försäkra dig om att så sker på följande sätt:

  • Lägg till omdirigeringar från HTTP-sidan till HTTPS-sidan.
  • Lägg till en länk med rel="canonical" från HTTP-sidan till HTTPS-sidan
  • Implementera HSTS.

Förhindra att Google felaktigt gör HTTP-sidan kanonisk genom att undvika följande:

  • Felaktiga SSL-certifikat och omdirigeringar från HTTPS till HTTP gör oss mycket benägna att välja HTTP. Du kan inte åsidosätta detta val genom att implementera HSTS.
  • Att ta med HTTP-sidan snarare än HTTPS-versionen i webbplatskartan eller hreflang-posterna.
  • Att implementera SSL/TLS-certifikatet för fel värdvariant, t.ex. om example.com används för certifikatet för www.example.com.  Certifikatet måste matcha webbplatsens fullständiga webbadress om det inte är ett certifikat med jokertecken som kan användas för flera underdomäner till en domän.

Tala om för Google att dynamiska parametrar ska ignoreras

Om Googlebot ska ignorera vissa parametrar vid genomsökningen kan du ange detta med hjälp av parameterhantering. Genom att ignorera vissa parametrar undviker vi att flera sidor med samma innehåll kommer med i Googles index. På så sätt blir det enklare att söka igenom din webbplats. Om du till exempel anger att parametern sessionid ska ignoreras kommer Google att se följande två webbadresser som dubbletter:

  • https://www.example.com/dresses/green.php?sessionid=273749
  • https://www.example.com/dresses/green.php

Beskrivning av metoderna

Välj en av metoderna nedan och ange en kanonisk webbadress för dubblettadresser eller dubblerade/snarlika sidor enligt den.

Följ de allmänna riktlinjerna ovan oavsett metod.

Ange en önskad domän

Med Search Console kan du tala om för Google vilken domän som ska vara den kanoniska när det finns flera versioner av webbplatsens adress:

  • https://www.example.com
  • https//example.com

Om du anger https://example.com som önskad domän behandlas snarlika webbadresser eller sidor på www.example.com som dubbletter av sidorna på example.com.

Läs Ange önskad domän om du vill veta mer.

Med taggen link och attributet rel=canonical

Du kan ange när en sida är en dubblett av en annan med hjälp av taggen <link> i sidans huvud.

Anta till exempel att https://example.com/dresses/green-dresses ska vara den kanoniska webbadressen även om ett antal olika webbadresser leder till samma innehåll. Du anger webbadressen som kanonisk så här:

  1. Markera alla dubblettsidor med taggen link rel="canonical". Lägg till ett <link>-element med attributet rel="canonical" som pekar på den kanoniska sidan i <head>-avsnittet på dubblettsidorna, så här:
    <link rel="canonical" href="https://example.com/dresses/green-dresses" />

  2. Om det finns en mobilvariant av den kanoniska sidan länkar du till den med rel="alternate":
    <link rel="alternate" media="only screen and (max-width: 640px)"  href="http://m.example.com/dresses/green-dresses">

  3. Lägg till hreflang-omdirigeringar eller andra omdirigeringar om det behövs för sidan.

Använd absoluta snarare än relativa sökvägar med länkelementet rel="canonical".

Använd det här formatet:  https://www.example.com/dresses/green/greendresss.html
och inte det här: /dresses/green/greendress.html
Med rel=canonical i HTTP-huvudet

Om du har möjlighet att konfigurera servern kan du ange den kanoniska webbadressen för PDF-filer och andra dokument som inte är HTML genom att ange rel="canonical" i HTTP-huvudet (snarare än med HTML-taggar).

Om det till exempel går att öppna en PDF-fil via flera webbadresser kan du returnera rel="canonical" i HTTP-huvudet för dubblettadresserna och därigenom tala om för Googlebot vilken som är PDF-filens kanoniska webbadress:

Link: <http://www.example.com/downloads/white-paper.pdf>; rel="canonical"

För närvarande har Google bara stöd för den här metoden för webbsökning.

Använd absoluta snarare än relativa sökvägar med länkelementet rel="canonical". Det vill säga:
Använd det här formatet:  http://www.example.com/downloads/white-paper.pdf
och inte det här: /downloads/white-paper.pdf
Med en webbplatskarta

Välj en kanonisk webbadress för var och en av sidorna och skicka dem i en webbplatskarta. Alla sidor i en webbplatskarta ses som föreslag till kanoniska sidor. Googlebot avgör vilka sidor som är dubbletter (om det finns några) utifrån hur likartat innehållet är.

Vi garanterar inte att vi använder webbadresserna i webbplatskartan som kanoniska, men det är ett enkelt sätt att definiera kanoniska sidor på en stor webbplats och ett praktiskt sätt att tala om för Google vilka sidor på webbplatsen som du anser är viktigast.

Lägg inte till sidor som inte är kanoniska i en webbplatskarta. Om du använder en webbplatskarta ska du bara ange kanoniska webbadresser i den.

Med 301-omdirigeringar för inaktuella webbadresser

Använd den här metoden om du har dubblettsidor som ska tas bort, men vill ha en smidig övergångsperiod innan de gamla webbadresserna försvinner.

Anta att din sida kan nås på flera sätt:

  • https://example.com/home
  • https://home.example.com
  • https://www.example.com

Välj en av dessa webbadresser som kanonisk webbadress och skicka trafik från de andra webbadresserna till den önskade webbadressen med 301-omdirigering. 301-omdirigering på servern är det bästa sättet att se till att användare och sökmotorer omdirigeras till rätt sida. Statuskoden 301 betyder att en sida har flyttats permanent till en ny plats.

Var den här artikeln till hjälp?
Hur kan vi förbättra den?