Wyszukiwarka
Wyczyść wyszukiwanie
Zamknij wyszukiwanie
Aplikacje Google
Menu główne
true

Konsolidacja duplikatów adresów URL

Definiowanie strony kanonicznej wśród stron podobnych lub powtórzonych

W skrócie

Jeśli masz jedną stronę, którą można otworzyć przy użyciu wielu adresów URL, lub wiele stron o podobnej treści (na przykład stronę w wersji na komputery i urządzenia mobilne), musisz wyraźnie poinformować Google, który adres URL tej strony jest najważniejszy (kanoniczny). Jeśli tego nie zrobisz, Google wybierze adres za Ciebie albo uzna oba adresy za równorzędne, co może prowadzić do niepożądanych efektów, które opisujemy w następnej sekcji.

Pamiętaj, że chociaż zalecamy określenie strony kanonicznej na wypadek wystąpienia duplikatów adresów URL lub różnych wersji strony, Google może na podstawie algorytmu wybrać inną stronę jako kanoniczną z różnych powodów, na przykład ze względu na jej treść lub wydajność.

Po co mi podobne lub powtórzone strony?

Istnieją praktyczne powody, dla których witryna może mieć różne adresy URL prowadzące do jednej strony albo do powtórzonych bądź bardzo podobnych stron. Oto najczęstsze z nich:

  • Aby obsługiwać wiele typów urządzeń:
    https://example.com/wiadomości/żarłoczny-koala
    https://m.example.com/wiadomości/żarłoczny-koala
    https://amp.example.com/wiadomości/żarłoczny-koala
    
  • Aby stosować dynamiczne adresy URL na potrzeby parametrów wyszukiwania lub identyfikatorów sesji:
    https://www.example.com/produkty?kategoria=sukienki&kolor=zielony
    https://example.com/sukienki/koktajlowe?gclid=ABCD
    https://www.example.com/sukienki/zielony/zielonasukienka.html
  • Jeśli system bloga automatycznie zapisuje różne adresy URL, gdy umieścisz ten sam post w różnych sekcjach:
    https://blog.example.com/sukienki/zielone-sukienki-są-super/
    https://blog.example.com/zieleń/zielone-sukienki-są-super/
  • Jeśli serwer jest tak skonfigurowany, by wyświetlać te same treści na stronach www i innych niż www albo http i https:
    http://example.com/zielone-sukienki
    https://example.com/zielone-sukienki
    http://www.example.com/zielone-sukienki
    
  • Jeśli treści umieszczone na blogu w celu redystrybucji w innych witrynach są w nich powielane częściowo lub w całości:
    https://news.example.com/zielone-sukienki-na-co-dzień-155672.html (post po redystrybucji) https://blog.example.com/sukienki/zielone-sukienki-są-super/3245/ (post oryginalny)
Drobne szczegóły
Informacje przedstawione poniżej prawdopodobnie są zbyt rozbudowane jak na Twoje potrzeby, więc możesz je pominąć. Zaprezentujemy je jednak tak czy inaczej, na wypadek gdyby Cię zainteresowały.
Gdy Googlebot indeksuje witrynę, próbuje określić tematy poruszone na jej poszczególnych stronach. Jeśli znajdzie w jednej witrynie wiele stron i uzna, że dotyczą tego samego tematu, wybiera tę, która wyda mu się najpełniejsza i najbardziej przydatna – i ją oznacza jako kanoniczną. Strona kanoniczna będzie odtąd indeksowana najczęściej, a jej duplikaty z mniejszą częstotliwością, co ma na celu zmniejszenie obciążenia indeksowaniem witryny. Jeśli więc nie powiesz Googlebotowi, która strona jest kanoniczna, a on wybierze inną, możesz poświęcać czas i energię na aktualizowanie strony, której nie będzie on indeksować zbyt często ani wyświetlać w wynikach wyszukiwania.
Google używa stron kanonicznych witryny jako standardu do oceniania jej zawartości i jakości. W wynikach wyszukiwania też najczęściej wyświetlane są strony kanoniczne, chyba że w danej sytuacji któryś z duplikatów znacznie lepiej pasuje do zapytania użytkownika – na przykład jeśli użytkownik korzysta z komórki, w wynikach wyszukiwania najprawdopodobniej pojawi się strona mobilna, nawet jeśli jako kanoniczna została wskazana strona na komputery.
Google wybiera strony kanoniczne na podstawie wielu czynników (lub sygnałów), takich jak to, czy strona jest wyświetlana przez http czy https. Takim sygnałem może też być na przykład zadeklarowana przez użytkownika preferowana domena, jakość strony, obecność adresu URL w mapie witryny czy etykieta „rel=canonical”. Nie możesz narzucić Google wyboru strony kanonicznej, ale możesz na niego wpłynąć, stosując techniki opisane poniżej.

Dlaczego jest to ważne

Istnieje wiele powodów, dla których warto wyraźnie wybrać spośród zbioru stron powtórzonych i podobnych stronę kanoniczną:

  • Aby określić adres URL, który ma być widoczny w wynikach wyszukiwania. Możesz skonfigurować witrynę tak, by użytkownicy trafiali na stronę produktu, którym jest zielona sukienka, znajdującą się pod adresem https://www.example.com/sukienki/zielony/zielonesukienki.html, a nie https://example.com/sukienki/koktajlowe?gclid=ABCD.
  • Aby skonsolidować sygnały linków dla podobnych lub zduplikowanych stron. Możliwość konsolidowania informacji o poszczególnych adresach URL (np. linków, które do nich prowadzą) w jednym preferowanym adresie URL upraszcza działanie wyszukiwarek. Oznacza to, że linki z innych witryn do strony http://example.com/sukienki/koktajlowe?gclid=ABCD zostaną skonsolidowane z linkami do strony https://www.example.com/sukienki/zielony/zielonesukienki.html.
  • Aby uprościć śledzenie danych w przypadku pojedynczego produktu/tematu. W przypadku dużej liczby różnych adresów URL trudniej jest uzyskać skonsolidowane dane dla poszczególnych fragmentów treści.
  • Aby zarządzać materiałami redystrybuowanymi. Jeśli redystrybuujesz treści do publikacji w innych domenach, lepiej, by do rankingu stron był brany pod uwagę preferowany URL.
  • Aby nie tracić czasu na indeksowanie duplikatów stron. Googlebot powinien skupić się na jak najdokładniejszym monitorowaniu treści w Twojej witrynie, lepiej więc, żeby indeksował nowe lub zaktualizowane strony, a nie różne ich wersje na komputery i komórki.

Które adresy URL Google uważa za kanoniczne (a które za duplikaty)?

Aby dowiedzieć się, które adresy URL są uważane za kanoniczne lub zduplikowane, skorzystaj z raportu Stan indeksowania. Duplikaty są w nim oznaczone jako wykluczone, a strony kanoniczne – jako prawidłowe.

Wyszukaj prawidłowe adresy URL oznaczone jako „Strona zindeksowana; warto ustawić ją jako kanoniczną”, by sprawdzić, które strony być może powinny zostać oznaczone jako kanoniczne.

Wyszukaj wykluczone adresy URL oznaczone jako „Wyszukiwarka Google wybrała inną stronę kanoniczną niż użytkownik”, by sprawdzić, w których przypadkach wybór Google różni się od Twojego.

Określanie strony kanonicznej

Istnieje kilka różnych sposobów wskazywania strony kanonicznej wśród duplikatów stron, w zależności od potrzeb:

Metoda Opis
Wytyczne ogólne Przestrzegaj ich w przypadku wszystkich metod wskazywania strony kanonicznej.
Określanie preferowanej domeny

Użyj Search Console, by określić adresy URL w jednej domenie jako kanoniczne względem ich odpowiedników w innej domenie. Na przykład: example.com, a nie www.example.com. Używaj tej metody tylko w przypadku dwóch podobnych witryn, które różnią się od siebie wyłącznie subdomeną. Nie używaj jej do wskazywania witryn różniących się protokołem http/https.

Zalety:

  • Bardzo łatwa do stosowania, zarządzania i zmiany.
  • Przydatna, gdy masz identyczne witryny w różnych domenach.

Wady:

  • Działa tylko na poziomie domeny, a strony muszą mieć identyczne ścieżki i nazwy, by zostały uznane za duplikaty.
  • Umożliwia jedynie mapowanie par stron o identycznych ścieżkach.
Tag <link> rel=canonical

Dodaj wskazujący stronę kanoniczną tag <link> w kodzie wszystkich zduplikowanych stron.

Zalety:

  • Pozwala zmapować nieskończoną liczbę zduplikowanych stron.

Wady:

  • Może zwiększyć rozmiar strony.
  • Mapowanie może stać się zbyt skomplikowane w większych witrynach lub tam, gdzie adresy URL często się zmieniają.
  • Działa tylko w przypadku stron HTML, nie działa w przypadku plików, np. PDF. Możesz wtedy użyć nagłówka HTTP rel=canonical.
Nagłówek HTTP rel=canonical

Umieść nagłówek rel=canonical w odpowiedzi dla Googlebota.

Zalety:

  • Nie zwiększa rozmiaru strony.
  • Pozwala zmapować nieskończoną liczbę zduplikowanych stron.

Wady:

  • Mapowanie może stać się zbyt skomplikowane w większych witrynach lub tam, gdzie adresy URL często się zmieniają.
Mapa witryny

Określ strony kanoniczne w mapie witryny.

Zalety:

  • Łatwa do stosowania i utrzymywania, zwłaszcza w przypadku dużych witryn.

Wady:

  • Googlebot nadal musi określić duplikaty powiązane ze stronami kanonicznymi zadeklarowanymi w mapie witryny.
  • Mniej wyraźny sygnał dla Googlebota niż technika mapowania rel=canonical.
Przekierowanie 301 Użyj przekierowań 301, by poinformować Googlebota, że adres URL przekierowania jest lepszą wersją niż adres analizowany. Używaj tej metody tylko wtedy, gdy wycofujesz duplikat strony.
Wersja AMP Jeśli jedna z wersji strony jest stroną AMP, postępuj zgodnie ze wskazówkami dotyczącymi standardu AMP, by wskazać stronę kanoniczną i jej wersję AMP.

 

Zachęcamy do korzystania z tych metod, przy czym żadna nie jest obowiązkowa. Jeśli nie określisz kanonicznego adresu URL, my wybierzemy adres według nas optymalny.

Wytyczne ogólne

Niezależnie od tego, którą metodę wskazywania strony kanonicznej wybierzesz, przestrzegaj tych wytycznych.

Wytyczne ogólne
  • Nie używaj pliku robots.txt do wskazywania strony kanonicznej.
  • Nie używaj narzędzia do usuwania adresów URL do wskazywania strony kanonicznej, bo usunie ono wszystkie wersje URL-a z wyszukiwania.
  • Nie określaj różnych URL-i jako kanonicznych dla tej samej strony, korzystając z tej samej lub różnych metod wskazywania strony kanonicznej (np. nie określaj jednego URL-a w mapie witryny, a innego URL-a dla tej samej strony przy użyciu atrybutu rel="canonical").
  • Nie używaj tagu noindex, by zapobiec wyborowi strony kanonicznej. Służy on do wykluczania strony z indeksu, a nie zarządzania wyborem strony kanonicznej. 
  • Określ stronę kanoniczną, jeśli używasz tagów z atrybutem hreflang. Wskaż stronę kanoniczną w tym samym języku lub w najbliższym języku zastępczym, jeśli nie istnieje ona w danym języku.

Pierwszeństwo protokołu HTTPS przed HTTP w URL-ach kanonicznych

Jako kanoniczne Google woli określać strony HTTPS, a nie równoważne strony HTTP, poza sytuacjami, w których – jak w poniższych przykładach – występują problemy lub sygnały wzajemnie się wykluczające:

  • Strona HTTPS ma nieprawidłowy certyfikat SSL.
  • Strona HTTPS zawiera niezabezpieczone zależności (inne niż obrazy).
  • Strona HTTPS przekierowuje użytkowników do strony HTTP lub przez taką stronę.
  • Strona HTTPS wskazuje stronę HTTP w linku rel="canonical".

Chociaż nasze systemy domyślnie wybierają strony HTTPS zamiast stron HTTP, możesz zdecydować, by robiły tak zawsze. W tym celu wykonaj jedną z tych czynności:

  • Dodaj przekierowania ze strony HTTP do strony HTTPS.
  • Dodaj link rel="canonical" ze strony HTTP do strony HTTPS.
  • Użyj mechanizmu HSTS.

Aby zapobiec nieprawidłowemu interpretowaniu przez Google strony HTTP jako kanonicznej, unikaj tych praktyk:

  • Nieprawidłowe certyfikaty SSL i przekierowania HTTPS-do-HTTP wpływają na znaczne preferowanie stron HTTP. Wykorzystanie mechanizmu HSTS nie umożliwia obejścia określonego w ten sposób wysokiego priorytetu strony.
  • Dodanie strony HTTP do mapy witryny lub wpisów hreflang zamiast wersji HTTPS.
  • Użycie własnego certyfikatu SSL/TLS dla złego wariantu hosta, np. adresu example.com serwującego certyfikat dla adresu www.example.com.  Certyfikat musi pasować do pełnego URL-a witryny lub być certyfikatem typu Wildcard, którego można używać w odniesieniu do wielu subdomen domeny.

Powiedz Google, że ma ignorować parametry dynamiczne

Aby poinformować Googlebota o wszelkich parametrach, które ma ignorować podczas indeksowania, skorzystaj z sekcji Obsługa parametrów. Ignorowanie niektórych parametrów może pomóc wyeliminować powielone treści w indeksie Google i ułatwić pobieranie witryny do zindeksowania. Jeśli na przykład określisz, że parametr sessionid ma być ignorowany, Googlebot będzie traktować dwa poniższe adresy jako duplikaty:

  • https://www.example.com/sukienki/zielony.php?sessionid=273749
  • https://www.example.com/sukienki/zielony.php

Metody specjalne

Aby określić kanoniczny adres URL dla duplikatów adresów URL lub zduplikowanych bądź podobnych stron, wybierz jedną z poniższych metod.

Pamiętaj o przestrzeganiu opisanych powyżej wytycznych ogólnych.

Ustaw domenę preferowaną

Użyj Search Console, by poinformować Google, którą wersję adresu URL witryny wolisz oznaczyć jako kanoniczną dla domeny:

  • https://www.example.com
  • https://example.com

Jeśli jako preferowaną domenę ustawisz https://example.com, Google będzie traktować podobne adresy URL lub strony w witrynie www.example.com jako duplikaty stron w witrynie example.com.

Szczegółowe informacje znajdziesz w artykule Ustawianie preferowanej domeny.

Użyj tagu <link> rel="canonical"

Możesz umieścić w nagłówku strony tag <link>, by wskazać, że dana strona jest duplikatem innej.

Załóżmy, że chcesz określić adres https://example.com/sukienki/zielone-sukienki jako kanoniczny URL, nawet jeśli do tej samej treści prowadzą także inne URL-e. Aby go oznaczyć jako kanoniczny, wykonaj te czynności:

  1. Oznacz wszystkie duplikaty stron elementem link rel="canonical". Dodaj element <link> z atrybutem rel="canonical" do sekcji <head> duplikatów stron, aby wskazać stronę kanoniczną, w ten sposób:
    <link rel="canonical" href="https://example.com/sukienki/zielone-sukienki" />

  2. Jeśli strona kanoniczna ma wersję na komórki, dodaj do niej link rel="alternate" prowadzący do tej mobilnej wersji:
    <link rel="alternate" media="only screen and (max-width: 640px)"  href="http://m.example.com/sukienki/zielone-sukienki">

  3. Dodaj dowolny parametr hreflang lub inne przekierowania odpowiednie dla strony.

Stosuj bezwzględne ścieżki dostępu zamiast ścieżek względnych z elementem link rel="canonical".

Używaj tej struktury: https://www.example.com/sukienki/zielony/zielonasukienka.html
Nie używaj takiej struktury: /sukienki/zielony/zielonasukienka.html.
Używaj nagłówka HTTP rel="canonical"

Jeśli masz możliwość konfigurowania serwera, kanoniczne adresy URL dokumentów innych niż HTML, na przykład plików PDF, możesz wskazywać przy użyciu nagłówków HTTP rel="canonical" (zamiast tagów HTML).

Jeśli na przykład udostępniasz plik PDF przy użyciu wielu adresów URL, to w przypadku duplikatów adresów URL możesz zwracać nagłówek HTTP rel="canonical" podobny do poniższego, by poinformować Googlebota, jaki jest adres kanoniczny tego pliku:

Link: <http://www.example.com/dopobrania/biała-księga.pdf>; rel="canonical"

Obecnie Google obsługuje tę metodę tylko w odniesieniu do wyników wyszukiwania w internecie.

Stosuj bezwzględne ścieżki dostępu zamiast ścieżek względnych z elementem link rel="canonical". Czyli:
Używaj tej struktury: http://www.example.com/dopobrania/biała-księga.pdf
Nie używaj takiej struktury: /dopobrania/biała-księga.pdf
Używaj mapy witryny

Wybierz kanoniczne adresy URL wszystkich stron i prześlij je w mapie witryny. Wszystkie strony wymienione w mapie witryny są proponowane jako kanoniczne. Na podstawie podobieństwa ich zawartości Googlebot decyduje, które z nich, ewentualnie, są duplikatami.

Nie gwarantujemy, że uznamy adresy URL z mapy witryny za kanoniczne, ale jest to prosty sposób na definiowanie adresów kanonicznych w przypadku dużych witryn. Poza tym mapy witryn pozwalają informować Google o tym, które strony są według Ciebie najważniejsze w witrynie.

Nie uwzględniaj w mapie witryny stron niekanonicznych. Jeśli korzystasz z mapy witryny, określ w niej wyłącznie adresy kanoniczne.

Użyj przekierowań 301 w przypadku wycofanych adresów URL

Skorzystaj z tej metody, jeśli chcesz się pozbyć istniejących duplikatów stron, ale nie możesz pozwolić sobie na to, by pojawiły się problemy związane z wycofaniem starych adresów.

Powiedzmy, że na Twoją stronę można wejść przy użyciu tych adresów:

  • https://example.com/strona_główna
  • https://home.example.com
  • https://www.example.com

Wybierz jeden z tych adresów jako kanoniczny adres URL i użyj przekierowań 301, by przekierować na niego ruch z pozostałych adresów. Przekierowanie 301 po stronie serwera stanowi najlepszy sposób, by wyszukiwarki, a przez to także użytkownicy, odnajdywały właściwą stronę. Kod stanu 301 oznacza, że strona została na stałe przeniesiona do innej lokalizacji.

Czy ten artykuł był pomocny?
Jak możemy ją poprawić?