Konsolidace duplicitních adres URL

Definování kanonické stránky pro stejné nebo podobné stránky

Pokud máte jednu stránku přístupnou pomocí několika adres URL nebo různé stránky s podobným obsahem (například stránku ve verzi pro mobily a pro počítače), Google je považuje za duplicitní verze stejné stránky. Jednu adresu URL vybere Google jako kanonickou verzi a bude ji procházet. Všechny ostatní adresy URL budou považovány za duplicitní a budou procházeny méně často. 

Pokud Googlu explicitně nesdělíte, která adresa URL je kanonická, Google ji buď vybere za vás, nebo oběma přiřadí stejnou váhu, což může vést k nechtěnému chování popsanému níže v části Proč bych měl(a) vybrat kanonickou adresu URL?

Co je to kanonická adresa URL?
Kanonická adresa URL je adresa stránky, kterou Google ze sady duplicitních stránek na vašem webu považuje za nejreprezentativnější. Jestliže pro jednu stránku máte několik adres URL (například example.com?saty=1234 a example.com/saty/1234), Google jednu z nich vybere jako kanonickou. Stránky přitom nemusejí být zcela identické. Stránky se seznamy s drobnými rozdíly v řazení nebo filtrování (například seřazení podle ceny nebo filtrování podle barvy položky) nejsou považovány za jedinečné.
Kanonická stránka může být v jiné doméně než její duplikát.
Další podrobnosti
Googlebot se při indexování webu snaží zjistit primární obsah každé stránky. Pokud na jednom webu najde několik stránek, které se zdají být stejné, vybere tu, kterou považuje za nejúplnější a nejužitečnější, a označí ji za kanonickou. Kanonickou stránku budeme procházet nejčastěji, duplicitní stránky budeme procházet méně často, aby Google váš web při procházení tolik nezatěžoval.
Google vybírá kanonické stránky na základě řady různých faktorů (nebo signálů), jako je například zobrazování prostřednictvím protokolu http nebo https, uživatelem deklarovaná preferovaná doména, kvalita stránky, přítomnost adresy URL v souboru Sitemap a označení rel=canonical. Pomocí těchto technik můžete Googlu sdělit své preference, ale Google může z různých důvodů vybrat jinou kanonickou stránku než vy.
Různé jazykové verze jedné stránky se považují za duplicitní jen v případě, že je hlavní obsah ve stejném jazyce (tj. pokud je přeloženo jen záhlaví, zápatí a další nedůležitý text, ale hlavní text zůstává stejný, stránky jsou považovány za duplicitní).
Kanonické stránky používá Google jako hlavní zdroj k vyhodnocování obsahu a kvality. Výsledek Vyhledávání Google obvykle odkazuje na kanonickou stránku. Výjimkou jsou případy, kdy je některý z duplikátů pro dotaz uživatele výslovně vhodnější: v případě uživatele na mobilním zařízení například bude výsledek vyhledávání pravděpodobně odkazovat na mobilní stránku, i když je za kanonickou označena stránka pro počítače.

Proč mohu mít podobné / duplicitní stránky?

Existují oprávněné důvody, proč na webu mohou být různé adresy URL odkazující na stejnou stránku nebo duplicitní či velmi podobné stránky na různých adresách URL. Zde jsou nejčastější z nich:

  • Podpora více typů zařízení:
    https://example.com/zpravy/besneni-koaly
    https://m.example.com/zpravy/besneni-koaly
    https://amp.example.com/zpravy/besneni-koaly
    
  • Používání dynamických adres URL pro věci, jako jsou parametry vyhledávání nebo ID relací:
    https://www.example.com/produkty?category=saty&color=zelene
    https://example.com/saty/koktejlove?gclid=ABCD
    https://www.example.com/saty/zelene/zelenesaty.html
  • Pokud jeden příspěvek umístíte do několika sekcí, blogový systém pro něj automaticky vytvoří několik adres URL:
    https://blog.example.com/saty/zelene-saty-jsou-skvele/
    https://blog.example.com/zelene-veci/zelene-saty-jsou-skvele/
  • Pokud je váš server nakonfigurován tak, aby zobrazoval stejný obsah pro varianty adres se subdoménou www i bez ní a s protokolem http i https:
    http://example.com/zelene-saty
    https://example.com/zelene-saty
    http://www.example.com/zelene-saty
    
  • Pokud je obsah, který na blogu poskytujete k syndikaci na jiné weby, v těchto doménách částečně nebo zcela replikován.
    http://zpravy.example.com/zelene-saty-pro-kazdy-den-155672.html (syndikovaný příspěvek) http://blog.example.com/saty/zelene-saty-jsou-skvele/3245/ (původní příspěvek)

Proč bych měl(a) vybrat kanonickou adresu URL?

K explicitnímu výběru kanonické stránky ze sady duplicitních nebo podobných stránek může být řada důvodů:

  • Zadání adresy URL, kterou lidem chcete zobrazovat ve výsledcích vyhledávání. Chcete, aby lidé vaši produktovou stránku zelených šatů navštěvovali spíše pomocí adresy https://www.example.com/saty/zelene/zelenesaty.html než pomocí adresy https://example.com/saty/koktejlove?gclid=ABCD.
  • Konsolidace signálů ohledně odkazů pro podobné nebo duplicitní stránky. Vyhledávačům pomáhá, pokud mohou informace, které mají pro jednotlivé adresy URL (například odkazy na ně), zkonsolidovat do jedné preferované adresy URL. To znamená, že odkazy z jiných webů na adresu http://example.com/saty/koktejlove?gclid=ABCD budou zkonsolidovány s odkazy na adresu https://www.example.com/saty/zelene/zelenesaty.html.
  • Měření metrik pro jeden produkt nebo téma. Pokud je k dispozici celá řada adres URL, je obtížnější získat konsolidované metriky pro konkrétní obsah.
  • Správa syndikovaného obsahu. Pokud svůj obsah syndikujete k zobrazení v jiných doménách, chcete hodnocení stránky konsolidovat na svoji preferovanou adresu URL.
  • Zabránění vynakládání času na procházení duplicitních stránek. Chcete, aby Googlebot z vašeho webu získal co nejvíc. Je proto lepší, aby na něm trávil čas procházením nových (nebo aktualizovaných) stránek, než aby procházel verze stejných stránek pro počítače a mobily.

Kterou adresu URL považuje Google za kanonickou?

Chcete-li zjistit, kterou stránku považuje Google za kanonickou, použijte nástroj Kontrola adresy URL. Upozorňujeme, že i když kanonickou stránku explicitně určíte, může Google z různých důvodů, jako je výkon nebo obsah, za kanonickou algoritmicky zvolit jinou stránku.

Odstraňování problémů

Pokud se kanonická adresa URL nachází ve službě, kterou nevlastníte, nebudete moci zobrazit žádný provoz na duplicitní stránce. Níže uvádíme několik běžných důvodů, proč k této situaci může dojít:
  • Nesprávně označené jazykové varianty: Pokud máte více webů, které nabízejí v podstatě stejný obsah lokalizovaný pro uživatele z různých částí světa, postupujte podle pokynů pro lokalizované stránky nebo weby.
  • Nesprávné značky kanonických verzí: Některé systémy správy obsahu (CMS) nebo pluginy systémů CMS mohou techniky kanonizace použít chybně a odkazovat na adresy URL na externích webech. Zkontrolujte obsah, zda se nejedná o tento případ. Pokud váš web uvádí neočekávanou preferenci kanonické adresy URL, například v důsledku chybného použití prvku rel="canonical" nebo přesměrování 301, opravte tuto chybu přímo.
  • Nesprávně nakonfigurované servery: Neočekávaný výběr adresy URL z jiné domény mohou způsobit i některé chyby v konfiguraci hostingu. Příklad:
    • Server může být nakonfigurován, aby při zadání dotazu na adresu URL v doméně a.com vracel výsledky z domény b.com.
    • Dva navzájem nesouvisející servery mohou vrátit shodné stránky s falešnou chybou 404, které Google nerozpozná jako stránky chyb.
  • Škodlivý obsah vložený hackery: Při některých útocích hackeři na weby přidávají kód, který vrací přesměrování 301 protokolu HTTP nebo do části <head> či do záhlaví kódu HTTP vkládá prvek link s atributem rel="canonical", jenž obvykle odkazuje na adresu URL se škodlivým či spamovým obsahem. V těchto případech mohou naše algoritmy namísto adresy URL na webu, jehož zabezpečení bylo takto narušeno, vybrat příslušnou škodlivou či spamovou adresu.
  • Zneužívání vašeho obsahu jiným webem: Ve vzácných případech může náš algoritmus vybrat adresu URL z externího webu, který bez vašeho svolení hostuje váš obsah. Pokud se domníváte, že je váš obsah duplikován na jiném webu v rozporu s právními předpisy o autorských právech, můžete se obrátit na hostitele příslušného webu a požádat o jeho odstranění. Podáním žádosti dle zákona DMCA (Digital Millennium Copyright Act) můžete také požádat společnost Google, aby web porušující autorská práva odstranila z výsledků vyhledávání.

Zadání kanonické stránky

Kanonickou stránku lze v sadě duplicitních stránek podle použití označit za kanonickou několika způsoby:

Metoda Popis
Obecné pokyny U všech metod kanonizace postupujte podle těchto pokynů.
Zadání preferované domény

Pomocí Search Console můžete označit adresy URL v jedné doméně za kanonickou verzi protějšků v jiné doméně. Můžete například zadat, že se mají místo stránek v doméně www.example.com používat stránky v doméně example.com. Tuto možnost použijte pouze v případě, že máte dva podobné weby, které se liší pouze subdoménou. K rozlišení webů s protokolem http a https ji nepoužívejte.

Výhody:

  • Umožňuje velmi snadnou implementaci, správu a změny.
  • Použijte, pokud máte stejné weby v různých doménách.

Nevýhody:

  • Funguje pouze na úrovni domény, a aby stránky byly považovány za duplicitní, musejí mít stejnou cestu a název.
  • Umožňuje pouze mapování jedné stránky na jednu stránku u stránek se stejnými cestami a názvy.
Značka <link> s atributem rel=canonical

Do kódu všech duplicitních stránek přidejte značku <link> odkazující na kanonickou stránku.

Výhody:

  • Umožňuje namapování neomezeného počtu duplicitních stránek.

Nevýhody:

  • Může způsobit nárůst velikosti stránky.
  • Údržba mapování na větších webech nebo na webech, jejichž adresy URL se často mění, může být složitá.
  • Lze použít pouze pro stránky HTML, nikoliv pro soubory jako například PDF. V těchto případech použijte záhlaví protokolu HTTP rel=canonical.
Záhlaví protokolu HTTP rel=canonical

V odpovědi se stránkou odesílejte záhlaví rel=canonical.

Výhody:

  • Nezpůsobuje nárůst velikosti stránky.
  • Umožňuje namapování neomezeného počtu duplicitních stránek.

Nevýhody:

  • Údržba mapování na větších webech nebo na webech, jejichž adresy URL se často mění, může být složitá.
Sitemap

Uveďte kanonické stránky v souboru Sitemap.

Výhody:

  • Snadná implementace a údržba, zejména na velkých webech.

Nevýhody:

  • U všech kanonických stránek deklarovaných v souboru Sitemap musí Googlebot zjistit přidružené duplicitní stránky.
  • Googlebot tento signál považuje za slabší než mapování s atributem rel=canonical.
Přesměrování 301 Pomocí přesměrování 301 Googlebotu sdělte, že je přesměrovaná verze lepší než daná adresa URL. Tuto metodu použijte pouze v případě, že duplicitní stránku přestáváte podporovat.
Varianta AMP Je-li některá z variant stránka AMP, budete při uvádění kanonické stránky a varianty AMP muset postupovat podle pokynů pro stránky AMP.

 

Ačkoliv žádná z těchto metod není požadována, doporučujeme vám některou z nich použít. Pokud kanonickou adresu URL neurčíte, vybereme nejlepší verzi nebo adresu URL podle svého uvážení.

Obecné pokyny

U všech metod kanonizace dodržujte tyto obecné pokyny.

Obecné pokyny
  • Ke kanonizaci nepoužívejte soubor robots.txt.
  • Ke kanonizaci nepoužívejte nástroj na odstranění adres URL. Tento nástroj z vyhledávání odebere všechny verze adresy URL.
  • Neuvádějte pro jednu stránku více různých kanonických adres URL (například jednu v souboru Sitemap a jinou pro stejnou stránku pomocí atributu rel="canonical").
  • Nepoužívejte k zabránění výběru kanonické stránky direktivu noindex. Tato direktiva je určena k vyloučení stránky z indexu, nikoliv k výběru kanonické stránky. 
  • Při použití značek hreflang uvádějte kanonickou stránku. Uveďte kanonickou stránku ve stejném jazyce nebo nejlepším možném náhradním jazyce (pokud ve stejném jazyce není k dispozici).

  • V odkazech na svém webu odkazujte na kanonickou adresu URL, nikoliv na duplicitní adresy URL. Pokud budete konzistentně odkazovat na adresu URL, kterou považujete za kanonickou, Google vaši preferenci snáze pochopí.

Preferování protokolu HTTPS před protokolem HTTP pro kanonické odkazy

Jako kanonické stránky upřednostňuje Google před stránkami HTTP ekvivalentní stránky HTTPS. Výjimkou jsou případy, kdy dochází k problémům nebo se vyskytují konfliktní signály, jako například tyto:

  • Stránka HTTPS má neplatný certifikát SSL.
  • Stránka HTTPS obsahuje nezabezpečené závislé prvky (jiné než obrázky).
  • Stránka HTTPS uživatele přesměrovává prostřednictvím stránky HTTP nebo na stránku HTTP.
  • Stránka HTTPS obsahuje odkaz na stránku HTTP s atributem rel="canonical".

Ačkoli naše systémy stránky HTTPS před stránkami HTTP preferují již ve výchozím nastavení, můžete toto chování zajistit těmito způsoby:

  • přidat přesměrování ze stránky HTTP na stránku HTTPS,
  • přidat na stránku HTTP odkaz na stránku HTTPS s atributem rel="canonical",
  • implementovat mechanismus HSTS.

Chcete-li zajistit, aby Google za kanonickou stránku nevybral nesprávně stránku s protokolem HTTP, měli byste se vyhnout těmto praktikám:

  • V případě výskytu neplatných certifikátů SSL a přesměrování z adres HTTPS na adresy HTTP velmi výrazně preferujeme verzi HTTP. Použitím mechanismu HSTS této výrazné preferenci nezabráníte.
  • Zahrnutí stránky HTTP v souboru Sitemap nebo v záznamech hreflang namísto verze HTTPS.
  • Implementace certifikátu SSL/TLS pro nesprávnou variantu hostitele: například poskytování certifikátu pro doménu www.example.com z domény example.com.  Certifikát musí odpovídat úplné adrese URL webu nebo se musí jednat o certifikát se zástupnými symboly, který lze použít pro několik subdomén v doméně.

Pouze pokročilí uživatelé: Sdělení Googlu, že má ignorovat dynamické parametry

Pomocí pokynů ke zpracování parametrů Googlebota informujte o parametrech, které má při procházení ignorovat. Ignorováním některých parametrů můžete snížit množství duplicitního obsahu v indexu Google a usnadnit procházení vašeho webu. Pokud například zadáte, že parametr sessionid má být ignorován, bude Google považovat následující dvě adresy za duplicitní:

  • https://www.example.com/saty/zelene.php?sessionid=273749
  • https://www.example.com/saty/zelene.php

Konkrétní metody

K zadání kanonické adresy URL pro duplicitní adresy URL nebo duplicitní či podobné stránky použijte jednu z následujících metod.

U všech metod postupujte podle obecných pokynů uvedených výše.

Nastavení preferované domény

Pomocí služby Search Console Googlu sdělte, kterou verzi adresy URL webu chcete používat jako kanonickou:

  • https://www.example.com
  • https://example.com

Pokud preferovanou doménu nastavíte jako https://example.com, bude Google podobné adresy URL a stránky s doménou www.example.com považovat za duplicitní verze stránek v doméně example.com.

Další informace naleznete v článku Nastavení preferované domény.

Použití značky link s atributem rel="canonical"

Pokud je stránka duplikátem jiné stránky, můžete to uvést pomocí značky <link> v záhlaví.

Předpokládejme, že chcete, aby stránka https://blog.example.com/saty/zelene-saty-jsou-skvele/ byla kanonická, ačkoliv je tento obsah přístupný na různých adresách URL. Tuto adresu URL uveďte jako kanonickou pomocí těchto kroků:

  1. Všechny duplicitní stránky označte pomocí prvku link s atributem rel="canonical". Do sekce <head> duplicitních stránek přidejte prvek <link> s atributem rel="canonical" odkazující na kanonickou stránku, jako zde:
    <link rel="canonical" href="https://example.com/saty/zelene-saty" />

  2. Pokud má kanonická stránka mobilní verzi, přidejte na ni prvek link s atributem rel="alternate" odkazující na mobilní verzi:
    <link rel="alternate" media="only screen and (max-width: 640px)"  href="http://m.example.com/saty/zelene-saty">

  3. Přidejte přesměrování hreflang nebo jiná přesměrování, která jsou pro stránku vhodná.

V prvku link s atributem rel="canonical" použijte namísto relativních cest raději absolutní cesty.

Použijte tuto strukturu: https://www.example.com/saty/zelene/zelenesaty.html
Tuto strukturu nepoužívejte/saty/zelene/zelenesaty.html
Použití záhlaví protokolu HTTP rel = "canonical"

Pokud můžete konfigurovat svůj server, můžete kanonické adresy URL dokumentů jiného typu než HTML (například souborů PDF) uvádět pomocí záhlaví protokolu HTTP rel="canonical".

Jestliže například zobrazujete soubor PDF pomocí několika adres URL, můžete Googlebota informovat o kanonické adrese URL souboru PDF tím, že pro duplicitní adresy URL budete vracet záhlaví protokolu HTTP rel="canonical" podobné tomuto:

Link: <http://www.example.com/downloads/white-paper.pdf>; rel="canonical"

Google tuto metodu momentálně podporuje pouze u výsledků vyhledávání na webu.

V prvku link s atributem rel="canonical" použijte namísto relativních cest raději absolutní cesty. Vysvětlení:
Použijte tuto strukturu: http://www.example.com/downloads/white-paper.pdf
Tuto strukturu nepoužívejte/downloads/white-paper.pdf
Použití souboru Sitemap

Pro všechny své stránky vyberte kanonické adresy URL a odešlete je v souboru Sitemap. Všechny stránky uvedené v souboru Sitemap jsou navrženy jako kanonické. Googlebot podle podobnosti obsahu určí, které stránky jsou duplicitní (pokud některé duplicitní jsou).

Nezaručujeme, že adresy URL uvedené v souboru Sitemap budeme považovat za kanonické, ale jedná se o jednoduchý způsob definování kanonických adres pro velký web. Soubory Sitemap jsou užitečný způsob, jak Googlu sdělit, které stránky na svém webu považujete za nejdůležitější.

V souboru Sitemap nezahrnujte nekanonické stránky. Pokud jej používáte, zahrňte v něm pouze kanonické adresy URL.

Pro adresy URL, jejichž podpora byla ukončena, použijte přesměrování 301

Tuto metodu použijte, když se chcete zbavit existujících duplicitních stránek, ale potřebujete zajistit hladký přechod před ukončením podpory starých adres URL.

Předpokládejme, že lze stránku navštívit několika způsoby:

  • https://example.com/home
  • https://home.example.com
  • https://www.example.com

Jednu z těchto adres URL si vyberte jako kanonickou a pomocí přesměrování 301 odesílejte provoz z ostatních adres URL na tu preferovanou. Nejlepší způsob, jak zajistit, aby uživatelé i vyhledávače byli směrováni na správnou stránku, je přesměrování 301 na straně serveru. Stavový kód 301 znamená, že požadovaná stránka byla natrvalo přemístěna jinam.

Pokud používáte hostingovou službu, pokyny k nastavení přesměrování 301 vyhledejte v její dokumentaci.

Pomohl vám tento článek?
Jak bychom článek mohli vylepšit?