Raport Stan w indeksie

Pozwala sprawdzić, które z Twoich stron zostały zindeksowane, i czy podczas indeksowania witryny nie wystąpiły jakieś problemy.

 

RAPORT STAN W INDEKSIE

 

Czytanie raportu

Znacznie łatwiej będzie Ci zrozumieć ten raport, jeśli przeczytasz, jak działa wyszukiwarka Google.

Raport zawiera informacje o stanie indeksowania wszystkich adresów URL w Twojej usłudze, które udało się nam odwiedzić lub które próbowaliśmy odwiedzić. Strona podsumowania pokazuje wyniki dla wszystkich adresów URL w Twojej usłudze, pogrupowane według stanu (błąd, ostrzeżenie lub prawidłowy) i jego konkretnej przyczyny (np. Nie udało się odnaleźć przesłanego URL-a (404)). Kliknij wiersz tabeli, by wyświetlić wszystkie adresy URL, które mają ten sam stan lub przyczynę, i zobaczyć szczegółowe informacje o problemie.

 

Czy potrzebuję tego raportu?

Jeśli Twoja witryna zawiera mniej niż 500 stron, prawdopodobnie nie musisz korzystać z tego raportu. Zamiast tego znacznie łatwiej jest wyszukać witrynę w Google, wpisując site:Twoja_witryna, gdzie „Twoja_witryna” to URL strony głównej witryny bez prefiksu „http://” czy „https://”, na przykład site:example.com lub site:example.com/sklepzoologiczny. W wynikach wyszukiwania pojawią się strony, o których Google wie, że znajdują się w Twojej witrynie. Możesz dodać wyszukiwane hasła, by znaleźć określone strony w witrynie, na przykład site:example.com/sklepzoologiczny legwany zeberki.

 

Strona podsumowania

Raport najwyższego poziomu zawiera informacje o stanie indeksu wszystkich stron, które robot Google próbował zindeksować, pogrupowane według stanu i przyczyny.

Na co zwrócić uwagę

W miarę rozbudowywania witryny wykres powinien pokazywać stopniowo powiększającą się liczbę prawidłowo zindeksowanych stron. Jeśli zauważysz spadki lub skoki, przejdź do sekcji rozwiązywania problemów. Zawartość tabeli stanów na stronie podsumowania jest pogrupowana i posortowana według stanu i przyczyny. Najpierw musisz poprawić najpoważniejsze błędy.

Czego nie oczekiwać

  • Nie oczekuj, że wszystkie adresy URL w Twojej witrynie zostaną zindeksowane. Najważniejsze jest zindeksowanie kanonicznej wersji każdej strony. Zduplikowanealternatywne strony zostaną oznaczone w tym raporcie etykietą „Wykluczono”. Takie strony mają zasadniczo tę samą treść co strona kanoniczna. Jeśli masz strony oznaczone jako wersje zduplikowane lub alternatywne, to dobry znak – oznacza to, że znaleźliśmy wersję kanoniczną i ją zindeksowaliśmy. Wersję kanoniczną dowolnego adresu URL możesz znaleźć za pomocą narzędzia do sprawdzania adresów URL. Więcej informacji o przyczynach braku stron
  • Zindeksowanie nowych treści może zająć nam kilka dni. Aby przyspieszyć ten proces, poproś o zindeksowanie.

Stan

Każda strona może mieć jedną z tych wartości stanu:

  • Błąd: strona nie została zindeksowana. Aby uzyskać informacje o błędzie i sposobie jego naprawienia, przeczytaj opis konkretnego typu błędu. To są problemy, na których należy się skupić w pierwszej kolejności.
  • Ostrzeżenie: strona została zindeksowana, ale zawiera błąd, o którym musisz się dowiedzieć.
  • Wykluczono: strona nie została zindeksowana, ale uznaliśmy, że było to przez Ciebie zamierzone. Może to być na przykład strona zawierająca dyrektywę noindex lub zduplikowana strona kanoniczna, którą już zindeksowaliśmy w Twojej witrynie.
  • Prawidłowy: strona została zindeksowana.

Przyczyna

Każdy stan (Błąd, Ostrzeżenie, Prawidłowy, Wykluczono) ma konkretną przyczynę. Opisy poszczególnych typów stanu oraz sposobów ich obsługi znajdziesz poniżej.

Weryfikacja

Stan weryfikacji dla danego problemu. W pierwszej kolejności zajmij się rozwiązaniem problemów, które mają stan „Niepowodzenie” lub „Nie rozpoczęto”.

Informacje o weryfikacji

Po naprawieniu wszystkich wystąpień określonego problemu w witrynie możesz poprosić Google o zweryfikowanie zmian. Jeśli wszystkie znane wystąpienia znikną, problem zostanie oznaczony w tabeli stanów jako rozwiązany i umieszczony na dole. Search Console śledzi stan weryfikacji całego problemu, a także stan każdego jego wystąpienia. Po zniknięciu wszystkich wystąpień problem uznaje się za rozwiązany. (Informacje o rejestrowaniu stanów faktycznych – patrz: Stan weryfikacji problemuStan weryfikacji wystąpienia).

Więcej informacji o czasie trwania problemu

Czas trwania problemu to okres od pierwszego dnia, gdy wykryto jakiekolwiek wystąpienie tego problemu w Twojej witrynie, aż do 90 dni po zniknięciu z witryny ostatniego wystąpienia. Gdy minie 90 dni bez żadnych powtórzeń, problem jest usuwany z historii zgłoszeń.

Data pierwszego wykrycia problemu to moment, w którym problem został po raz pierwszy wykryty. Ta data jest niezmienna. Dlatego:

  • Jeśli wszystkie wystąpienia problemu zostaną naprawione, ale 15 dni później pojawi się nowe wystąpienie, problem zostanie oznaczony jako otwarty, ale datą „pierwszego wykrycia” pozostanie data pierwotna.
  • Jeśli ten sam problem wystąpi 91 dni po naprawieniu ostatniego wystąpienia, poprzedni problem będzie już zamknięty, więc obecne wystąpienie zostanie zarejestrowane jako nowy problem z datą pierwszego wykrycia ustawioną na „dzisiaj”.

Podstawowy proces weryfikacji

Oto omówienie procesu weryfikacji, który następuje po kliknięciu opcji Sprawdź poprawkę danego problemu. Proces może potrwać kilka dni. W tym czasie będziesz otrzymywać e-maile z powiadomieniami o postępach.

  1. Gdy klikniesz Sprawdź poprawkę, Search Console od razu sprawdza kilka stron.
    • Jeśli na dowolnej z tych stron znajdzie bieżące wystąpienie, weryfikacja kończy się, a jej stan się nie zmienia.
    • Jeśli na przykładowych stronach nie ma tego błędu, weryfikacja przechodzi do etapu Rozpoczęta. Jeśli weryfikacja wykaże inne, niepowiązane problemy, zostają one policzone jako problemy odpowiedniego typu i proces weryfikacji jest kontynuowany.
  2. Search Console sprawdza listę znanych adresów URL, których dotyczy dany problem. W kolejce do ponownego zindeksowania ustawiane są tylko adresy URL ze znanymi wystąpieniami problemu, a nie cała witryna. Search Console prowadzi rejestr wszystkich sprawdzonych adresów URL w historii weryfikacji, do której można przejść ze strony szczegółów problemu.
  3. Podczas sprawdzania adresu URL:
    1. Jeśli problem nie zostanie znaleziony, stan weryfikacji wystąpienia zmienia się na Powodzenie. Jeśli jest to pierwsze wystąpienie sprawdzone po rozpoczęciu weryfikacji, stan weryfikacji wystąpienia zmienia się na Wszystko w porządku.
    2. Jeśli adres URL jest już niedostępny, stan weryfikacji wystąpienia zmienia się na Inne (nie jest to stan błędu).
    3. Jeśli wystąpienie nadal jest obecne, stan problemu zmienia się na Niepowodzenie i weryfikacja się kończy. Jeśli jest to nowa strona wykryta podczas standardowego indeksowania, stwierdza się kolejne wystąpienie istniejącego problemu.
  4. Jeśli po sprawdzeniu wszystkich adresów URL z błędami i ostrzeżeniami liczba problemów wynosi 0, stan problemu zmienia się na Powodzenie. Ważne: nawet jeśli liczba stron, których dotyczy problem, spadnie do zera, a stan problemu zmieni się na Powodzenie, pierwotna etykieta wagi (Błąd lub Ostrzeżenie) będzie nadal widoczna.

Nawet jeśli nie klikniesz przycisku „Rozpocznij weryfikację”, Google może wykryć naprawione wystąpienia problemu. Jeśli podczas standardowego indeksowania Google wykryje, że wszystkie wystąpienia problemu zostały naprawione, stan problemu zmieni się w raporcie na „Nie dotyczy”.

Kiedy problem związany z adresem URL lub elementem jest uznawany za „rozwiązany”?

W przypadku adresu URL lub elementu problem jest oznaczany jako rozwiązany, gdy spełniony jest dowolny z tych warunków:

  • Adres URL został zindeksowany i na stronie nie wykryto już problemu. W przypadku błędu tagu AMP może to oznaczać, że tag został albo naprawiony, albo usunięty (jeśli nie jest wymagany). Próba weryfikacji da wówczas wynik „Powodzenie”.
  • Jeśli z jakiegokolwiek powodu strona będzie niedostępna dla Google (np. została usunięta lub oznaczona jako noindex, wymaga uwierzytelnienia itd.), problem dotyczący tego adresu URL zostanie uznany za rozwiązany. Przy próbie weryfikacji przypisany zostanie stan „Inne”.

Ponowna weryfikacja

Jeśli po nieudanej weryfikacji klikniesz Zweryfikuj ponownie, rozpocznie się ponowna weryfikacja wszystkich wystąpień z wynikiem Niepowodzenie oraz wszelkich nowych wystąpień problemu wykrytych podczas standardowego indeksowania.

Nawet jeśli w czasie trwania danego cyklu weryfikacji rozwiążesz jakiś problem, poczekaj na zakończenie cyklu, zanim poprosisz o rozpoczęcie kolejnego.

Wystąpienia, które pomyślnie przeszły weryfikację (zostały oznaczone jako Powodzenie) albo są już nieosiągalne (zostały oznaczone jako Inne), nie są sprawdzane ponownie. Po kliknięciu „Zweryfikuj ponownie” są usuwane z historii.

Historia weryfikacji

Postęp w realizacji prośby o weryfikację możesz sprawdzić, klikając link szczegółów weryfikacji na stronie szczegółów problemu.

Wpisy w historii weryfikacji są pogrupowane według adresów URL na potrzeby raportu AMP i raportu stanu indeksowania. Elementy w raportach dotyczących obsługi na urządzeniach mobilnych i wyników z elementami rozszerzonymi są pogrupowane według kombinacji adres URL + element uporządkowanych danych (zgodnie z wartością nazwy elementu). Stan weryfikacji odnosi się do konkretnego sprawdzanego problemu. Jeden problem może mieć na stronie etykietę „Powodzenie”, a inne mogą być oznaczone etykietą „Niepowodzenie”, „Oczekuje” lub „Inne”.

Stan weryfikacji problemu

Do problemu mogą zostać przypisane te stany weryfikacji:

  • Nie rozpoczęto: istnieje co najmniej jedna strona z wystąpieniem tego problemu, dla której nigdy nie podjęto próby weryfikacji. Dalsze kroki:
    1. Kliknij problem, by zapoznać się ze szczegółami błędu. Sprawdź poszczególne strony, by zobaczyć przykłady błędu na aktywnej stronie, korzystając z testu AMP (jeśli test AMP nie pokazuje błędu na stronie, jest to spowodowane tym, że błąd został naprawiony na aktywnej stronie już po wykryciu go przez Google i wygenerowaniu raportu o problemie).
    2. Kliknij „Więcej informacji” na stronie szczegółów, by zobaczyć szczegóły naruszonej reguły.
    3. Kliknij wiersz przykładowego adresu URL w tabeli, by zobaczyć szczegóły konkretnego błędu.
    4. Napraw błędy na swoich stronach, a następnie kliknij Sprawdź poprawkę, a Google ponownie zindeksuje Twoje strony. Google powiadomi Cię o postępach weryfikacji. Weryfikacja trwa od kilku dni do około dwóch tygodni – prosimy o cierpliwość. 
  • Rozpoczęto: rozpoczęto próbę weryfikacji i do tej pory nie znaleziono pozostałych wystąpień problemu. Dalsze kroki: w miarę postępów weryfikacji Google będzie wysyłać powiadomienia z informacjami o ewentualnej konieczności podjęcia jakichś działań.
  • Wszystko w porządku: rozpoczęto próbę weryfikacji i do tej pory wszystkie sprawdzone wystąpienia problemu zostały naprawione. Dalsze kroki: nic nie musisz robić; w miarę postępów weryfikacji Google będzie wysyłać powiadomienia z informacjami o ewentualnej konieczności podjęcia jakichś działań.
  • Powodzenie: wszystkie znane wystąpienia problemu zostały zlikwidowane (lub adres URL, którego dotyczył problem, jest już niedostępny). Przejście do tego stanu wymaga wcześniejszego kliknięcia opcji „Sprawdź poprawkę” (jeśli wystąpienia znikną bez zgłaszania prośby o weryfikację, stan zmieni się na „Nie dotyczy”). Dalsze kroki: nie musisz nic robić.
  • Nie dotyczy: Google uznaje problem za rozwiązany dla wszystkich adresów URL, nawet jeśli nigdy nie rozpoczęto próby weryfikacji. Dalsze kroki: nie musisz nic robić.
  • Niepowodzenie: po kliknięciu „Zweryfikuj” na określonej liczbie stron nadal występuje problem. Dalsze kroki: rozwiąż problem i przeprowadź ponowną weryfikację.

Stan weryfikacji wystąpienia

Po przesłaniu prośby o weryfikację każdemu znanemu wystąpieniu problemu jest przypisywany jeden z poniższych stanów weryfikacji konkretnego problemu (stany Powodzenie i Inne nie są stosowane w raportach stanu indeksowania):

  • Oczekuje na weryfikację: w kolejce do zweryfikowania. Podczas ostatniej kontroli Google wystąpienie problemu nadal istniało.
  • Powodzenie: kontrola Google wykazała, że to wystąpienie problemu nie istnieje. Do tego stanu można przejść wyłącznie poprzez celowe kliknięcie opcji Zweryfikuj dla danego wystąpienia problemu.
  • Niepowodzenie: kontrola Google wykazała, że dane wystąpienie problemu nie zniknęło. Do tego stanu można przejść wyłącznie poprzez celowe kliknięcie opcji Zweryfikuj dla danego wystąpienia problemu.
  • Inne: Google nie ma dostępu do adresu URL powiązanego z danym wystąpieniem albo (w przypadku uporządkowanych danych) nie może już znaleźć elementu na stronie. Jest to równoznaczne ze stanem Powodzenie.

Pamiętaj, że ten sam adres URL może mieć różne stany dla różnych problemów. Na przykład jeśli jedna strona zawiera zarówno problem X, jak i Y, problem X może mieć stan weryfikacji Powodzenie, a problem Y na tej samej stronie – stan Oczekująca.

Filtr wykrywania adresów URL

Widoczny nad wykresem filtr umożliwia filtrowanie wyników indeksu według sposobu, przy użyciu którego dany URL został wykryty przez Google. Dostępne są te wartości:

  • Wszystkie znane strony [wartość domyślna] – pokazuje wszystkie adresy URL wykryte przez Google dowolnym sposobem.
  • Wszystkie przesłane strony – pokazuje tylko strony przesłane w mapie witryny do tego raportu lub za pomocą pingu mapy witryny.
  • URL konkretnej mapy witryny – pokazuje tylko adresy URL wymienione w konkretnej mapie witryny przesłanej za pomocą tego raportu. Obejmuje to też wszystkie adresy URL w zagnieżdżonych mapach witryn.

URL jest uważany za przesłany w mapie witryny, nawet jeśli został też wykryty w inny sposób (na przykład w trakcie zwykłego indeksowania z innej strony).

Strona ze szczegółowymi informacjami

Kliknij wiersz na stronie podsumowania, by otworzyć stronę ze szczegółowymi informacjami o danej kombinacji stanu i przyczyny. Aby zobaczyć szczegółowe informacje o wybranym problemie, na stronie szczegółów kliknij Więcej informacji.

Dostępny na niej wykres przedstawia liczbę stron z problemami na przestrzeni czasu.

Tabela zawiera przykładową listę stron, których dotyczy dany problem:

  • Aby otworzyć URL w tabeli, kliknij link w odpowiadającym mu wierszu.
  • Aby sprawdzić URL w tabeli, kliknij ikonę inspekcji  w odpowiadającym mu wierszu.
  • Po naprawieniu wszystkich błędów lub ostrzeżeń możesz poprosić Google o zweryfikowanie poprawek.

Przy adresie URL widzisz błąd, który został już naprawiony? Prawdopodobnie problem został rozwiązany PO ostatnim indeksowaniu przez Google. Dlatego też jeśli widzisz przy jakimś adresie URL błąd, który został już naprawiony, sprawdź datę jego ostatniego indeksowania. Sprawdź i potwierdź poprawkę, a następnie poproś o ponowne zindeksowanie.

 

Udostępnianie raportu

Możesz udostępnić szczegóły problemu, klikając przycisk Udostępnij na stronie. Osoba, której udostępnisz link, będzie mieć dostęp tylko do bieżącej strony i wszystkich stron historii sprawdzania poprawności dotyczących tego problemu. Link nie zapewnia dostępu do innych stron witryny ani nie umożliwia tej osobie wykonywania jakichkolwiek czynności w Twojej usłudze lub na Twoim koncie. Link możesz w dowolnym momencie unieważnić, wyłączając udostępnianie tej strony.

Rozwiązywanie problemów

Możesz potwierdzić stan indeksowania dowolnego adresu URL pokazywanego w tym raporcie. Wystarczy, że sprawdzisz ten adres:

  1. W tabeli z przykładami na stronie ze szczegółowymi informacjami kliknij URL, by otworzyć panel boczny z opcjami testowania.
  2. W panelu bocznym kliknij Sprawdź URL, by poznać więcej informacji o wersji strony w indeksie Google.
  3. W raporcie o zindeksowanych stronach sprawdź sekcje Stan w indeksie > SkanowanieStan w indeksie > Indeksowanie, by poznać informacje o stanie skanowania oraz indeksowania strony. Aby przetestować opublikowaną wersję strony, kliknij Sprawdź URL wersji opublikowanej.

Częste problemy

Oto niektóre typowe problemy z indeksowaniem, które mogą pojawić się w tym raporcie:

Spadek całkowitej liczby zindeksowanych stron bez powiązanych błędów

Jeśli zauważysz spadek łącznej liczby zindeksowanych stron bez powiązanych błędów, być może blokujesz dostęp do istniejących stron (za pomocą pliku robots.txt, tagu noindex lub wymogu logowania), które nie zostały przesłane do indeksowania. Po przesłaniu tych stron do indeksowania zobaczysz powiązany zestaw błędów. Sprawdź adresy URL ze stanem Wykluczono pod kątem nagłego wzrostu, który odpowiada spadkowi liczby stron ze stanem Prawidłowy.

Więcej stron wykluczonych niż prawidłowych

Jeśli liczba stron ze stanem Wykluczono przekracza liczbę stron ze stanem Prawidłowy, sprawdź przyczyny wykluczenia. Najczęstsze przyczyny wykluczenia:

  • Masz regułę pliku robots.txt, która uniemożliwia nam indeksowanie dużych sekcji Twojej witryny. Jeśli blokujesz niewłaściwe strony, odblokuj je.
  • Twoja witryna ma dużo zduplikowanych stron, prawdopodobnie dlatego, że używa parametrów do filtrowania lub sortowania wspólnych kolekcji (np. typ=sukienka, kolor=zielony lub sortowanie=cena). Te strony prawdopodobnie powinny być wykluczone, jeśli tylko wyświetlają te same treści, które są sortowane, filtrowane lub otwierane na różne sposoby. Jeśli jesteś zaawansowanym użytkownikiem i uważasz, że Google błędnie interpretuje parametry w Twojej witrynie, możesz użyć narzędzia Parametry w URL-ach, by dostosować sposób obsługi parametrów witryny.
Nagły wzrost liczby błędów

Nagłe wzrosty liczby błędów mogą być spowodowane zmianą w szablonie, która wprowadziła nowy błąd, albo zawartymi w przesłanej mapie witryny adresami URL zablokowanymi przed indeksowaniem (np. za pomocą pliku robots.txt, tagu noindex lub wymogu logowania). Kliknij problem i sprawdź stronę, by zobaczyć, co jest nie tak.

Jeśli zauważysz nagły wzrost liczby błędów:

  1. Sprawdź, czy nie występuje korelacja między łączną liczbą błędów indeksowania lub łączną liczbą zindeksowanych stron a miniwykresem  obok wiersza danego błędu na stronie podsumowania. Może to pomóc w znalezieniu problemu, który wpływa na łączną liczbę błędów lub łączną liczbę zindeksowanych stron.
  2. Kliknij dowolny wiersz błędu, który wydaje się przyczyniać do wzrostu liczby błędów, by przejść na stronę ze szczegółowymi informacjami. Przeczytaj opis konkretnego typu błędu, by dowiedzieć się, jak najlepiej go naprawić.
  3. Napraw wszystkie błędy i poproś o weryfikację. Aby to zrobić, kliknij Sprawdź poprawkę na stronie ze szczegółowymi informacjami o danej przyczynie. Więcej informacji o weryfikowaniu
  4. W miarę postępów weryfikacji będziesz otrzymywać powiadomienia, ale aby sprawdzić, czy liczba błędów się zmniejszyła, zajrzyj do raportu za kilka dni.
  5. Od czasu do czasu usuwaj filtr wykluczonych adresów URL, sortuj je według liczby stron z problemami oraz skanuj pod kątem wszelkich niechcianych problemów.
Błędy serwera
Błąd serwera oznacza, że Googlebot nie mógł uzyskać dostępu do adresu URL, upłynął czas oczekiwania na realizację żądania lub witryna je odrzuciła. W efekcie Googlebot musiał zrezygnować z żądania.

Sprawdzanie połączenia z serwerem

Korzystając z narzędzia do sprawdzania adresów URL, możesz zobaczyć, czy potrafisz odtworzyć błąd serwera zgłoszony w raporcie „Stan w indeksie”.

Jak naprawić błąd połączenia z serwerem?

  • Skróć czas wczytywania stron dynamicznych.
    Witryna jest dynamiczna, jeśli udostępnia te same treści pod różnymi adresami URL (np. www.example.com/buty.php?kolor=czerwony&rozmiar=37 zawiera to samo co www.example.com/buty.php?rozmiar=37&kolor=czerwony). Uzyskanie odpowiedzi strony dynamicznej może trwać zbyt długo, co powoduje błąd przekroczenia czasu oczekiwania. Serwer może też zgłosić stan przeciążenia, by Googlebot wolniej indeksował witrynę. Zalecamy stosowanie krótkich i nielicznych list parametrów. Jeśli dokładnie wiesz, jak działają parametry w Twojej witrynie, możesz dać nam znać, jak je obsługiwać.
  • Upewnij się, że serwer z Twoją witryną nie jest wyłączony, przeciążony ani błędnie skonfigurowany.
    Jeśli nadal zdarzają się problemy z połączeniem, czasem oczekiwania lub uzyskaniem odpowiedzi, skontaktuj się ze swoją firmą hostingową i zastanów się nad zwiększeniem możliwości obsługi żądań przez witrynę.
  • Sprawdź, czy dostęp do Twojej witryny nie został przypadkowo zablokowany.
    Dostęp Googlebota może być zablokowany z powodu problemu w systemie, takiego jak błąd konfiguracji DNS, nieprawidłowe ustawienia zapory sieciowej lub systemu ochrony przed atakami DoS. Problem może też powodować konfiguracja systemu zarządzania treścią. Systemy ochrony stanowią ważny element poprawnej usługi hostingowej i często ich konfiguracja powoduje automatyczne blokowanie adresów, z których do serwera jest przesyłana nadzwyczaj duża liczba żądań. Googlebot często przesyła więcej żądań niż zwykły użytkownik, dlatego może wywołać reakcję systemu ochrony, który go zablokuje i uniemożliwi zindeksowanie witryny. Aby rozwiązać problem tego typu, sprawdź, który element infrastruktury witryny blokuje Googlebota, a następnie usuń blokadę. Jeśli nie masz kontroli nad ustawieniami zapory sieciowej, skontaktuj się ze swoim dostawcą usług hostingowych.
  • Rozważnie zarządzaj indeksowaniem witryny.
    Niektórzy webmasterzy celowo utrudniają Googlebotowi dostęp do witryny, wykorzystując np. zaporę sieciową. Celem zazwyczaj nie jest całkowite zablokowanie Googlebota, ale kontrolowanie sposobu pobierania i indeksowania witryny. Jeśli stosujesz takie metody, zapoznaj się z tymi wskazówkami:
Błędy 404

Zalecamy naprawienie tylko stron z błędami 404, a nie wykluczonych stron z komunikatem 404. Adresy URL stron z błędami 404 to adresy, których nie udało nam się znaleźć, mimo że otrzymaliśmy od Ciebie wyraźną prośbę o ich zindeksowanie. Z kolei adresy URL wykluczonych stron z komunikatem 404 to adresy odkryte przy użyciu innego sposobu.

Oto jak należy postępować w przypadku błędów 404:

  1. Sprawdź, czy warto usuwać te błędy. Wielu (o ile nie większości) błędów 404 nie warto usuwać, ponieważ błędy 404 nie mają szkodliwego wpływu na indeksowanie ani pozycję Twojej witryny.
    • Jeśli błąd dotyczy przesłanego adresu URL, warto go naprawić.
    • Jeśli błąd dotyczy usuniętej strony, która nie ma odpowiednika ani zamiennika, zwracanie kodu 404 jest właściwym rozwiązaniem. Błędy 404 powinny zniknąć z raportu po około miesiącu.
    • Jeśli błąd dotyczy nieprawidłowego adresu URL wygenerowanego przez skrypt albo nieistniejącego w Twojej witrynie, prawdopodobnie nie musisz się tym przejmować. Pojawienie się takiego błędu w raporcie może być denerwujące, ale nie trzeba go usuwać, chyba że adres URL zawiera link z częstym błędem ortograficznym (patrz poniżej). Błędy 404 powinny zniknąć z raportu po około miesiącu.
  2. Jeśli adres URL został przesłany do zindeksowania (jego stan to Błąd):
    1. Sprawdź, skąd przesłano URL: kliknij obok niego ikonę przesyłania Szukaj, i spójrz na Wykrywalność. W razie potrzeby zaktualizuj mapę witryny.
    2. Jeśli treść została przeniesiona, użyj przekierowania.
    3. Jeśli treść jest całkowicie usunięta i nie planujesz zastąpić jej nowszą, podobną treścią, to stary URL powinien zwracać błąd 404 lub 410. Obecnie Google traktuje błąd 410 (Brak) tak samo jak 404 (Nie znaleziono). Zwrócenie kodu innego niż 404 i 410 w przypadku nieistniejącej strony (lub przekierowanie użytkowników do innej strony, np. strony głównej, zamiast zwrócenia błędu 404) może być przyczyną problemów. Oznacza to pozorny błąd 404, co może utrudniać znajdywanie stron przez użytkowników i wyszukiwarki.
    4. Jeśli URL jest nieznany: niekiedy mogą się pojawiać błędy 404 odnoszące się do adresów URL, których w ogóle nie było w Twojej witrynie. Takie błędy mogą wystąpić, gdy ktoś przechodzi do adresu URL, który nie istnieje w Twojej witrynie – być może w wyniku błędnego wpisania go w przeglądarce lub błędnego linku. Jeśli to bardzo częsty błąd, możesz utworzyć przekierowanie dla takiego adresu.
      Kolejną przyczyną zgłaszania takich błędów przez Googlebota może być próba przejścia do linków zawartych w skryptach JavaScript, plikach Flash i innych osadzonych treściach albo do linków istniejących tylko w mapie witryny. Na przykład w witrynie może znajdować się kod, który śledzi pobieranie plików w Google Analytics:
      <a href="helloworld.pdf"
        onClick="_gaq.push(['_trackPageview','/download-helloworld']);">
        Hello World PDF</a>

      Gdy Googlebot natrafi na taki kod, może próbować zindeksować URL http://www.example.com/download-helloworld, nawet jeśli nie jest to prawdziwa strona. W raporcie Błędy indeksowania taki link może się wtedy pojawić jako błąd 404 (Nie znaleziono). Szukamy obecnie sposobu, który zapobiegnie takim błędom indeksowania. Ten błąd nie ma wpływu na stan zindeksowania ani pozycję Twojej witryny.

  3. Nie twórz fałszywych treści, przekierowań na stronę główną ani nie blokuj błędów 404 w pliku robots.txt. Takie działania utrudniają nam analizę struktury Twojej witryny i jej prawidłowe przetwarzanie. Tego rodzaju błędy nazywamy pozornymi błędami 404.Gdy pomyślnie zindeksujemy URL, możemy indeksować go nieustannie. Użycie przekierowania 300 opóźni próbę ponownego zindeksowania, być może na dłuższy czas. Zgłoszenie prośby o usunięcie adresu URL w narzędziu do usuwania adresów URL nie oznacza, że błąd zniknie z tego raportu.
Brakujące strony lub witryny

Jeśli strony w ogóle nie ma w raporcie, prawdopodobnie wynika to z jednej z tych przyczyn:

  • Google nie wie o stronie. Uwagi na temat wykrywalności stron:
    • Jeśli jest to nowa witryna lub strona, pamiętaj, że może minąć trochę czasu, zanim Google ją znajdzie i zindeksuje.
    • Jeśli chcesz, byśmy dowiedzieli się o określonej stronie, prześlij mapę witryny lub poproś o zindeksowanie strony. W przeciwnym razie będziemy musieli znaleźć gdzieś link do niej.
    • Gdy już znamy adres URL strony, może minąć trochę czasu (do kilku tygodni), zanim zindeksujemy część lub całość Twojej witryny.
    • Indeksowanie nigdy nie następuje od razu, nawet jeśli poprosisz o nie bezpośrednio.
  • Google nie może wyświetlić Twojej strony (wymaga ona logowania lub z innych przyczyn nie jest dostępna dla wszystkich użytkowników internetu).
  • Strona zawiera tag noindex, który uniemożliwia Google jej zindeksowanie.
  • Z jakiegoś powodu strona została pominięta w indeksie.

Sposób naprawy:

Użyj narzędzia do sprawdzania adresów URL, by zobaczyć problem na stronie. Jeśli strony nie ma w raporcie Stan w indeksie, ale jest wymieniona w raporcie narzędzia do sprawdzania adresów URL jako zindeksowana, prawdopodobnie została zindeksowana niedawno i wkrótce pojawi się w raporcie Stan w indeksie. Jeśli w narzędziu do sprawdzania adresów URL strona jest wymieniona jako niezindeksowana (czego można się spodziewać), przetestuj opublikowaną stronę. Wyniki testu opublikowanej strony powinny wskazać istotę problemu: wykorzystaj informacje z testu i jego dokumentacji, by dowiedzieć się, jak rozwiązać problem.

Najczęstsze pytania

Dlaczego moja strona jest w indeksie? Nie chcę, by była indeksowana.

Google może indeksować każdy znaleziony URL, chyba że na stronie umieszczono dyrektywę noindex (lub adres został tymczasowo zablokowany). Google może znaleźć stronę na wiele różnych sposobów, np. gdy ktoś umieści w innej witrynie link, który do niej prowadzi.

  • Jeśli chcesz, by Twoja strona była zablokowana w wynikach wyszukiwania Google, możesz określić wymóg logowania się w celu uzyskania do niej dostępu lub użyć dyrektywy noindex.
  • Jeśli chcesz, by Twoja strona została usunięta z wyników wyszukiwania Google po jej znalezieniu, musisz wykonać te czynności.

Dlaczego moja witryna nie została ostatnio ponownie zindeksowana?

Googlebot ponownie indeksuje strony na podstawie różnych kryteriów, na przykład tego, jak często według niego strona się zmienia. Jeśli Twoja witryna nie zmienia się często, częstotliwość odświeżania może być mniejsza, co jest w porządku, o ile Twoje strony się nie zmieniły. Jeśli uważasz, że witryna wymaga odświeżenia, poproś Google o jej ponowne zindeksowanie.

Czy można ponownie zindeksować stronę/witrynę?

Poproś Google o ponowne zindeksowanie

Dlaczego tak wiele moich stron zostało wykluczonych?

Zapoznaj się z przyczynami wykluczenia wyszczególnionymi w raporcie Stan w indeksie. Najczęściej strona jest wykluczona, ponieważ:

  • Masz regułę w pliku robots.txt, która blokuje indeksowanie dużych sekcji Twojej witryny. Użyj narzędzia do sprawdzania adresów URL, by potwierdzić problem.
  • Twoja witryna ma dużo zduplikowanych stron, zazwyczaj dlatego, że używa parametrów do filtrowania lub sortowania wspólnych kolekcji (np. typ=sukienka, kolor=zielony lub sortowanie=cena). Te strony będą oznaczone w raporcie Stan w indeksie jako „zduplikowane” lub „alternatywne”.
  • Adres URL przekierowuje do innego adresu URL. Same przekierowania nie są indeksowane, ale docelowe strony przekierowania już tak.

Google nie może uzyskać dostępu do mojej mapy witryny

Sprawdź, czy mapa witryny nie jest zablokowana przez plik robots.txt, czy jest prawidłowa i czy używasz właściwego adresu URL we wpisie pliku robots.txt lub w przesłanym raporcie Mapy witryn. Sprawdź URL mapy witryny za pomocą publicznie dostępnych narzędzi do testowania map witryn.

Dlaczego Google wciąż indeksuje stronę, która została usunięta?

Google nadal indeksuje wszystkie znane adresy URL nawet po tym, jak przez jakiś czas zwracają one błędy 4XX, na wypadek, gdyby to były błędy tymczasowe. URL nie będzie już indeksowany tylko wtedy, gdy zwróci dyrektywę noindex.

Aby nie wyświetlała Ci się stale rosnąca lista błędów 404, raport Stan w indeksie zawiera tylko te adresy URL, które zwróciły błędy 404 w ciągu ostatniego miesiąca.

Skoro ja widzę swoją stronę, dlaczego Google jej nie widzi?

Użyj narzędzia do sprawdzania adresów URL, by sprawdzić, czy Google widzi opublikowaną stronę. Jeśli nie, narzędzie powinno wyjaśnić dlaczego. Jeśli tak, od czasu ostatniego indeksowania prawdopodobnie problem dostępu został rozwiązany. Przeprowadź indeksowanie wersji opublikowanej, korzystając z narzędzia do sprawdzania adresów URL, i poproś o zindeksowanie.

Narzędzie do sprawdzania adresów URL nie wykryło żadnych problemów, ale raport Stan w indeksie zawiera błąd. Dlaczego?

Być może błąd został naprawiony po ostatnim zindeksowaniu adresu URL przez Google. Sprawdź datę indeksowania Twojego adresu URL (powinna być widoczna na stronie ze szczegółowymi informacjami o adresie URL w raporcie Stan w indeksie lub w widoku wersji zindeksowanej w narzędziu do sprawdzania adresów URL). Sprawdź, czy od czasu indeksowania strony wprowadzono jakieś poprawki.

Jak znaleźć stan indeksowania określonego adresu URL?

Aby poznać stan indeksowania określonego adresu URL, użyj narzędzia do sprawdzania adresów URL. W raporcie Stan w indeksie nie można wyszukiwać ani filtrować według adresu URL.

Przyczyny stanów

Możliwe przyczyny poszczególnych stanów problemów:

Przyczyny stanu „Przesłano”

Za każdym razem, gdy w przyczynie indeksowania widzisz słowo „Przesłano”, oznacza to, że otrzymaliśmy od Ciebie wyraźną prośbę o zindeksowanie danego adresu URL wyrażoną poprzez przesłanie go w mapie witryny do raportu Mapy witryn. Za każdym razem, gdy widzisz słowo „Nie przesłano”, oznacza to, że Googlebot znalazł adres URL samodzielnie (na przykład z linku na innej stronie) i że tego adresu nie ma w żadnej ze zindeksowanych map witryn.

Błąd


Strony z błędami nie zostały zindeksowane.


Błąd serwera (5xx): po zgłoszeniu żądania strony Twój serwer zwrócił błąd na poziomie 500. Patrz Usuwanie błędów serwera.

Błąd przekierowania: robot Google napotkał jeden z tych błędów przekierowania: zbyt długi łańcuch przekierowań, pętla przekierowań, przekierowanie przekroczyło maksymalną długość dozwoloną dla adresu URL, zły lub pusty URL w łańcuchu przekierowań. Aby uzyskać więcej informacji na temat przekierowania, skorzystaj z narzędzia do debugowania takiego jak Lighthouse.

Przesłany URL jest zablokowany przez plik robots.txt: stronę przesłano do zindeksowania, ale została zablokowana przez plik robots.txt.

  1. Kliknij stronę w tabeli Przykłady, by rozwinąć panel boczny z narzędziami.
  2. Kliknij Przetestuj blokowanie przez plik robots.txt, by sprawdzić URL testerem pliku robots.txt. Narzędzie powinno wskazać regułę, która blokuje ten URL.
  3. Zaktualizuj plik robots.txt, by usunąć lub zmienić regułę (w zależności od potrzeb). Lokalizację tego pliku znajdziesz, klikając Sprawdź bieżący plik robots.txt w narzędziu testującym. Jeśli korzystasz z usług hostingu WWW i nie masz uprawnień do edytowania tego pliku, przeszukaj dokumentację usługi lub skontaktuj się z jej centrum pomocy i powiadom o tym problemie.

Przesłany URL zawiera tag „noindex”: stronę przesłano do zindeksowania, ale w metatagu lub nagłówku HTTP zawiera dyrektywę „noindex”. Jeśli chcesz, by ta strona została zindeksowana, usuń tag lub nagłówek HTTP. Aby potwierdzić problem, użyj narzędzia do sprawdzania adresów URL:

  1. Obok adresu URL w tabeli kliknij ikonę inspekcji .
  2. W sekcji Stan w indeksie > Indeksowanie > Czy indeksowanie jest dozwolone raport powinien pokazywać, że instrukcja noindex uniemożliwia indeksowanie.
  3. Potwierdź, że tag noindex nadal istnieje w opublikowanej wersji:
    1. Kliknij Sprawdź URL wersji opublikowanej.
    2. W sekcji Dostępność > Indeksowanie > Czy indeksowanie jest dozwolone sprawdź, czy dyrektywa noindex nadal jest wykrywana. Jeśli nie, kliknij Poproś o zindeksowanie, by wysłać do Google żądanie ponownego zindeksowania strony. Jeśli instrukcja noindex nadal jest obecna, musisz ją usunąć, by umożliwić zindeksowanie.

Przesłany adres URL wydaje się zgłaszać pozorny błąd 404: stronę przesłano do zindeksowania, ale serwer wydaje się zgłaszać pozorny błąd 404. Jak to naprawić

Przesłany URL zwraca błąd z powodu nieautoryzowanego żądania (401): stronę przesłano do zindeksowania, jednak wyszukiwarka Google uzyskała odpowiedź 401 (brak autoryzacji). Usuń z tej strony wymagania autoryzacji lub zezwól Googlebotowi na dostęp do Twoich stron po zweryfikowaniu jego tożsamości. Możesz sprawdzić ten błąd, odwiedzając stronę w trybie incognito.

Nie udało się odnaleźć przesłanego URL-a (404): do zindeksowania przesłano nieistniejący adres URL. Patrz Usuwanie błędów 404.

Przesłany URL zawiera błędy indeksowania: stronę przesłano do zindeksowania, ale wyszukiwarka Google napotkała nieokreślony błąd indeksowania, którego nie można przypisać do żadnej innej przyczyny. Spróbuj usunąć błędy ze strony za pomocą narzędzia do sprawdzania adresów URL.

Ostrzeżenie


Strony ze stanem Ostrzeżenie mogą wymagać Twojej interwencji. O tym, czy zostały zindeksowane, informuje konkretny wynik.


Strona zindeksowana, ale zablokowana przez plik robots.txt: strona została zindeksowana pomimo tego, że jest blokowana przez plik robots.txt (Google zawsze przestrzega instrukcji z pliku robots.txt, jednak ta blokada nie działa wtedy, gdy ktoś inny utworzy link do danej strony). Jest to ostrzeżenie, ponieważ nie jesteśmy pewni, czy chcesz uniemożliwić wyświetlanie strony w wynikach wyszukiwania. Jeśli chcesz zablokować tę stronę, plik robots.txt nie jest odpowiednim mechanizmem pozwalającym uniknąć indeksowania. Zamiast tego użyj tagu „noindex” lub zastosuj uwierzytelnianie, by nie zezwalać na anonimowy dostęp do strony. Aby sprawdzić, która reguła blokuje daną stronę, możesz użyć testera pliku robots.txt. Plik robots.txt powoduje, że każdy pokazywany fragment strony może być nieoptymalny. Jeśli nie chcesz blokować tej strony, zaktualizuj plik robots.txt, by ją odblokować.

Prawidłowy


Strony ze stanem Prawidłowy zostały zindeksowane.

Strona przesłana i zindeksowana: URL został przesłany do indeksowania i zindeksowany.

Strona zindeksowana, ale nieprzesłana w mapie witryny: URL został wykryty przez Google i zindeksowany. Zalecamy przesłanie wszystkich istotnych adresów URL w mapie witryny.

Wykluczono


Te strony zwykle nie są indeksowane i wydaje nam się, że tak powinno być. Są to duplikaty stron indeksowanych, strony, których indeksowanie blokuje jakiś mechanizm w Twojej witrynie, lub strony zablokowane z innego powodu, który uważamy za uzasadniony.


Strona wykluczona za pomocą tagu „noindex”: przy próbie zindeksowania tej strony wyszukiwarka Google napotkała instrukcję „noindex” i nie wykonała tego działania. Jeśli nie chcesz, by strona była indeksowana, udało Ci się. Jeśli chcesz, by strona została zindeksowana, usuń instrukcję „noindex”.

Strona zablokowana przez narzędzie do usuwania stron: strona jest obecnie zablokowana w związku z prośbą o usunięcie adresu URL. Jeśli jesteś zweryfikowanym właścicielem witryny, możesz użyć narzędzia do usuwania adresów URL, by sprawdzić, kto przesłał tę prośbę. Takie prośby są skuteczne przez około 90 dni od daty usunięcia adresu URL. Po tym czasie Googlebot może powrócić do strony i ją zindeksować, nawet jeśli nie prześlesz kolejnej prośby o zindeksowanie. Jeśli nie chcesz, by strona została zindeksowana, użyj tagu „noindex”, ustaw wymóg autoryzacji dla strony lub usuń stronę.

Strona zablokowana przez plik robots.txt: ta strona została zablokowana dla Googlebota za pomocą pliku robots.txt. Możesz to sprawdzić, używając testera pliku robots.txt. Pamiętaj, że nie oznacza to, że strona nie zostanie zindeksowana w inny sposób. Jeśli Google może wyszukać inne informacje na temat tej strony bez jej ładowania, strona może nadal zostać zindeksowana (choć zdarza się to rzadko). Aby mieć pewność, że strona nie zostanie zindeksowana przez Google, usuń blokadę z pliku robots.txt i użyj instrukcji „noindex”.

Strona zablokowana z powodu nieautoryzowanego żądania (401): strona została zablokowana dla Googlebota przez żądanie autoryzacji (odpowiedź 401). Jeśli chcesz, by Googlebot mógł zindeksować tę stronę, usuń wymagania autoryzacji lub zezwól Googlebotowi na dostęp do niej.

Nieprawidłowość związana ze skanowaniem: podczas pobierania tego adresu URL wystąpiła nieokreślona nieprawidłowość. Może to oznaczać kod odpowiedzi 4xx lub 5xx. Spróbuj pobrać stronę za pomocą narzędzia do sprawdzania adresów URL, by sprawdzić, czy nie występują problemy z pobieraniem. Strona nie została zindeksowana.

Strona zeskanowana, ale jeszcze nie zindeksowana: strona została zeskanowana, ale nie została jeszcze zindeksowana przez Google. Strona może zostać zindeksowana w przyszłości. Nie ma potrzeby ponownego przesyłania tego adresu URL do pobrania.

Strona wykryta – obecnie nie zindeksowana: strona została już znaleziona, ale nie została jeszcze zindeksowana przez Google. Najczęstszą przyczyną tego stanu jest to, że podczas próby zindeksowania danego adresu URL przez Google strona była przeciążona i indeksowanie zostało zaplanowane na później. Właśnie dlatego data ostatniego indeksowania w raporcie jest pusta.

Alternatywna strona zawierająca prawidłowy tag strony kanonicznej: ta strona to duplikat strony rozpoznanej przez Google jako strona kanoniczna. Ta strona prawidłowo wskazuje stronę kanoniczną, więc nie musisz nic robić.

Duplikat, użytkownik nie oznaczył strony kanonicznej: ta strona ma duplikaty, z których żaden nie został oznaczony jako strona kanoniczna. Według naszej oceny to nie jest strona kanoniczna. Wskaż jednoznacznie adres kanoniczny dla tej strony. Sprawdzenie tego adresu URL powinno wykazać kanoniczny URL wybrany przez Google.

Duplikat, wyszukiwarka Google wybrała inną stronę kanoniczną niż użytkownik: ten URL jest oznaczony jako kanoniczny dla zestawu stron, ale wyszukiwarka Google uznała, że inny URL lepiej sprawdzi się jako strona kanoniczna. Wyszukiwarka Google zindeksowała stronę, którą uznała za kanoniczną, zamiast tej strony. Zalecamy jednoznaczne oznaczenie tej strony jako duplikatu kanonicznego adresu URL. Ta strona została wykryta bez wyraźnej prośby o zindeksowanie. Sprawdzenie tego adresu URL powinno wykazać kanoniczny URL wybrany przez Google.

Nie znaleziono (404): ta strona zwraca po jej zażądaniu błąd 404. Wyszukiwarka Google wykryła ten adres URL bez wyraźnej prośby o zindeksowanie oraz bez mapy witryny. Wyszukiwarka Google mogła wykryć adres URL jako link z innej witryny lub możliwe, że ta strona wcześniej występowała, ale została usunięta. Googlebot prawdopodobnie będzie jeszcze przez jakiś czas dalej sprawdzać ten URL. Nie da się pokierować działaniem Googlebota w taki sposób, by zapomniał trwale adres URL, może on jednak indeksować stronę coraz rzadziej. Odpowiedź 404 nie stanowi problemu, o ile jest zwracana celowo. Jeśli strona została przeniesiona, użyj przekierowania 301 do nowej lokalizacji. Przeczytaj sekcję Usuwanie błędów 404.

Strona usunięta w wyniku skargi prawnej: strona została usunięta z indeksu na podstawie skargi prawnej.

Strona zawiera przekierowanie: URL to przekierowanie, dlatego nie został dodany do indeksu.

Pozorny błąd 404: żądanie strony zwraca prawdopodobnie pozorną odpowiedź 404. Oznacza to, że wyświetla się przystępny komunikat „nie znaleziono” bez właściwego kodu odpowiedzi 404. Zalecamy zwracanie kodu odpowiedzi 404 w przypadku rzeczywiście „nieznalezionych” stron lub uzupełnianie stron o dodatkowe informacje, by zasygnalizować nam, że nie chodzi o pozorny błąd 404. Więcej informacji

Duplikat, przesłany URL nie został oznaczony jako strona kanoniczna: URL to jeden z wielu duplikatów adresów URL bez jednoznacznie oznaczonej strony kanonicznej. Pomimo przesłanego przez Ciebie wyraźnego żądania ten URL nie został zindeksowany przez Google, ponieważ wyszukiwarka Google uznała, że inny URL będzie lepszym kanonicznym adresem URL. Zamiast tego zindeksowaliśmy wybrany przez nas URL kanoniczny. (Spośród zbioru duplikatów Google indeksuje tylko kanoniczny URL). Różnica między tym stanem a stanem „Wyszukiwarka Google wybrała inną stronę kanoniczną niż użytkownik” polega na tym, że w tym przypadku została zgłoszona przez Ciebie wyraźna prośba o indeksowanie. Sprawdzenie tego adresu URL powinno wykazać kanoniczny URL wybrany przez Google.

Czy to było pomocne?
Jak możemy ją poprawić?