Raport Statystyki indeksowania

Raport Statystyki indeksowania zawiera statystyki dotyczące historii indeksowania Twojej witryny przez Google. Możesz w nim na przykład sprawdzić liczbę wysłanych żądań, czas i treść odpowiedzi serwera oraz napotkane problemy z dostępnością. Raport pozwala też ustalić, czy podczas indeksowania Twojej witryny Google napotyka problemy z wyświetlaniem.

Raport jest przeznaczony dla zaawansowanych użytkowników. Jeśli Twoja witryna ma mniej niż 1000 stron, najprawdopodobniej nie musisz korzystać z tego raportu ani przejmować się tym poziomem indeksowania.

Raport jest dostępny tylko dla usług najwyższego poziomu. To oznacza, że obejmuje usługi domeny (np. example.com lub m.example.com) albo usługi z prefiksem URL na najwyższym poziomie (https://example.com, http://example.com, http://m.example.com).

Otwórz raport Statystyki indeksowania

C<span/>rawl Budget and the Crawl Stats report - Google Search Console Training

Aby wyświetlić raport Statystyki indeksowania w Search Console, kliknij

(Ustawienia usługi) > Statystyki indeksowania.

Pierwsze kroki

Zanim zaczniesz używać tego raportu, zapoznaj się z tymi informacjami:

Jak działa wyszukiwarka Google
Tematy dla zaawansowanych użytkowników, w szczególności dotyczące skanowania, indeksowania i map witryn.
Różne tematy dotyczące zarządzania dostępem do Twojej witryny, w tym blokowania za pomocą plików robots.txt.
Jeśli masz dużą witrynę (setki tysięcy stron), dowiedz się, jak rozwiązywać problemy z budżetem indeksowania i jak nim zarządzać.

Informacje o danych

Wszystkie widoczne i zliczane adresy URL to adresy, których Google rzeczywiście żąda. Dane nie są przypisywane do kanonicznych adresów URL tak jak w niektórych innych raportach.
W przypadku adresów URL, które powodują przekierowania po stronie serwera, każde żądanie w łańcuchu przekierowań jest zliczane osobno. Załóżmy, że strona 1 przekierowuje na stronę 2, która z kolei przekierowuje na stronę 3. Jeśli Google zażąda strony 1, zobaczysz osobne żądania strony 1 (strona zwróci kod 301/302), strony 2 (strona zwróci kod 301/302) i strony 3 (przy odrobinie szczęścia strona zwróci kod 200). Pamiętaj, że widoczne są tylko strony z bieżącej domeny. Odpowiedź przekierowania ma typ pliku „Inny typ pliku”. Przekierowania po stronie klienta nie są zliczane.
Próby indeksowania, które nie zostały zrealizowane, ponieważ plik robots.txt był niedostępny, są uwzględnianie w łącznej liczbie indeksowań, ale informacje o nich w raporcie mogą być mniej szczegółowe. Więcej informacji
Zasoby i zakres:
- Wszystkie dane pochodzą z aktualnie wybranej domeny. Żądania wysyłane do innych domen nie będą wyświetlane. Obejmuje to żądania wszystkich zasobów strony (np. obrazów) hostowanych poza tą usługą. Jeśli więc Twoja strona example.com/mojastrona zawiera obraz google.com/img.png, jego żądanie nie zostanie uwzględnione w raporcie Statystyki indeksowania dla usługi example.com.
- Żądania wysyłane do domen równorzędnych (np. en.example i de.example) również nie będą widoczne. Zatem w raporcie Statystyki indeksowania dotyczącym domeny en.example nie zobaczysz żądań obrazu w domenie de.example.
- Z poziomu domeny nadrzędnej można jednak zobaczyć żądania przesyłane między subdomenami. Jeśli na przykład wyświetlisz dane dotyczące domeny example.com, zobaczysz wszystkie żądania wysłane do domeny example.com, en.example, de.example.com i wszystkich domen podrzędnych na dowolnym poziomie poniżej domeny example.com.
- I na odwrót: jeśli zasoby usługi są używane przez stronę w innej domenie, możesz zobaczyć żądania indeksowania powiązane ze stroną hostującą, ale nie poznasz kontekstu wskazującego, że zasób jest indeksowany, ponieważ jest on używany przez stronę w innej domenie. Innymi słowy, nie będzie widać, że obraz example.com/obrazX.png został zindeksowany, ponieważ znajduje się na stronie anotherexample.com/mojastrona.
- Dane indeksowania obejmują protokoły HTTP i HTTPS, nawet w przypadku usług z prefiksami URL. Oznacza to, że raport Statystyki indeksowania dotyczący adresu http://example.com obejmuje żądania strony http://example.com oraz https://example.com. Jednak przykładowe adresy URL usług z prefiksami URL uwzględniają tylko protokół zdefiniowany na potrzeby danej usługi (http lub https).

Znany problem: raport Statystyki indeksowania zawiera obecnie większość żądań indeksowania, ale niektóre żądania mogą nie być zliczane z różnych powodów. Spodziewamy się, że z czasem raport będzie obejmował większość żądań, a może nawet wszystkie. Dlatego możesz zauważyć niewielkie różnice między danymi w dziennikach żądań witryny i danymi w raportach.

Poruszanie się po raporcie

Raport zawiera te informacje o indeksowaniu Twojej witryny:

łączna liczba żądań robota indeksującego,
całkowity rozmiar pobierania,
średni czas odpowiedzi,
stan hosta,
odpowiedzi na żądania robota indeksującego,
typ pliku,
cel indeksowania,
typ Googlebota.

Kliknij dowolny wpis w tabeli, aby wyświetlić szczegółowy widok elementu wraz z listą przykładowych adresów URL. Kliknij URL, aby zobaczyć szczegóły konkretnego żądania robota indeksującego. Na przykład w tabeli prezentującej odpowiedzi pogrupowane według typu kliknij wiersz HTML, by zobaczyć zbiorcze informacje o indeksowaniu wszystkich stron HTML przeskanowanych w Twojej witrynie oraz szczegóły takie jak czas indeksowania, kod odpowiedzi czy rozmiar odpowiedzi przykładowego zbioru tych adresów URL.

Hosty i domeny podrzędne

W przypadku usługi na poziomie domeny (example.com, http://example.com, https://m.example.com), która zawiera co najmniej 2 domeny podrzędne (np. fr.example.com i de.example.com), możesz wyświetlić dane dotyczące domeny nadrzędnej i wszystkich domen podrzędnych lub dane dotyczące tylko jednej domeny podrzędnej.

Aby wyświetlić raport dotyczący określonej domeny podrzędnej, kliknij ją na liście Hosty na stronie docelowej domeny nadrzędnej. W raporcie widać tylko pierwsze 20 domen podrzędnych, w których w ciągu ostatnich 90 dni wystąpił ruch.

Przykładowe adresy URL

Możesz kliknąć dowolny wpis dotyczący określonego typu danych (odpowiedź, typ pliku, cel, typ Googlebota), by wyświetlić listę przykładowych adresów URL tego typu.

Przykładowe adresy URL nie wyczerpują wszystkich możliwości, ale stanowią reprezentatywny przykład. Jeśli nie widzisz adresu URL na liście, nie oznacza to, że nie wysłaliśmy dotyczącego go żądania. Liczba przykładów może być ważona według dnia, więc niektóre typy żądań mogą obejmować więcej przykładów niż inne. W miarę upływu czasu ich liczba powinna się wyrównać.

Łączna liczba żądań robota indeksującego

Łączna liczba wysłanych do Twojej witryny żądań indeksowania adresów URL – zarówno zrealizowanych, jak i niezrealizowanych. Obejmuje żądania dotyczące używanych przez stronę zasobów, które znajdują się w Twojej witrynie. Żądania dotyczące zasobów hostowanych poza Twoją witryną nie są zliczane. Duplikaty żądań dotyczące tego samego adresu URL są zliczane osobno. Jeśli plik robots.txt jest niedostatecznie dostępny, potencjalne pobrania są zliczane.

Niezrealizowane żądania, które zostały zliczone, zawierają:

Pobrania, które nigdy nie zostały zrealizowane, ponieważ plik robots.txt był niewystarczająco dostępny.
Pobrania, które nie zostały zrealizowane z powodu problemów z rozpoznawaniem nazw DNS.
Pobrania, które nie zostały zrealizowane z powodu problemów z połączeniem z serwerem.
Pobrania, które zostały porzucone z powodu występowania pętli przekierowań.

Całkowity rozmiar pobierania

Łączna liczba bajtów pobranych z Twojej witryny podczas indeksowania w określonym przedziale czasu. Jeśli robot Google przechowuje w pamięci podręcznej zasób strony, który jest używany przez wiele stron, żądanie dotyczące tego zasobu zostanie wysłane tylko raz (wtedy zostanie on zapisany w pamięci podręcznej).

Średni czas odpowiedzi

Średni czas odpowiedzi wszystkich zasobów pobranych z Twojej witryny w określonym przedziale czasu. Każdy zasób, do którego strona utworzyła link, jest liczony jako osobna odpowiedź.

Stan hosta

Stan hosta wskazuje, czy podczas próby zindeksowania witryny przez Google wystąpiły problemy z dostępnością. Stan może mieć 1 z tych wartości:

W ciągu ostatnich 90 dni robot Google nie napotkał żadnych poważnych problemów z dostępnością podczas indeksowania Twojej witryny. Tak trzymaj! Nie musisz nic więcej robić.
W ciągu ostatnich 90 dni robot Google indeksujący Twoją witrynę napotkał co najmniej 1 istotny problem z dostępnością, który wystąpił ponad tydzień temu. Możliwe, że był to tylko chwilowy błąd lub problem został już rozwiązany. Przejrzyj dane z tabeli Odpowiedź, by zobaczyć, jakie wystąpiły problemy, i zdecydować, czy musisz podjąć jakieś działania.
W ciągu ostatniego tygodnia robot Google indeksujący Twoją witrynę napotkał co najmniej 1 istotny problem z dostępnością. Problem wystąpił niedawno, dlatego warto sprawdzić, czy nie jest to błąd pojawiający się regularnie. Przejrzyj dane z tabeli Odpowiedź, by zobaczyć, jakie problemy wystąpiły, i zdecydować, czy musisz podjąć jakieś działania.

Na co zwrócić uwagę

Idealnie host powinien mieć stan zielony. Jeśli stan dostępności to czerwony, kliknij, by zobaczyć szczegółowe informacje o dostępności pliku robots.txt, wyszukiwaniu DNS i połączeniu z hostem.

Informacje o stanie hosta

Stan dostępności hosta jest oceniany z uwzględnieniem poniższych kategorii. Poważny błąd w którejkolwiek kategorii może powodować przypisanie stanu niższej dostępności. Kliknij kategorię w raporcie, by zobaczyć więcej informacji.

W każdej kategorii jest dostępny wykres prezentujący dane indeksowania z określonego przedziału czasu. Na wykresie znajduje się przerywana czerwona linia – jeśli w danej kategorii wartość ją przekracza (na przykład w danym dniu wyszukiwanie DNS zakończy się niepowodzeniem w ponad 5% żądań), oznacza to, że w tej kategorii wystąpił problem. Stan odzwierciedla czas, jaki upłynął od ostatniego wystąpienia błędu.

Pobieranie pliku robots.txt
Wykres pokazuje odsetek żądań pliku robots.txt niezrealizowanych podczas indeksowania. Google często wysyła żądanie tego pliku. Jeśli nie zwróci ono prawidłowego pliku (wypełnionego lub pustego) albo kodu 404 (plik nie istnieje), Google spowolni lub zatrzyma indeksowanie witryny do momentu otrzymania akceptowalnej odpowiedzi na żądanie pliku robots.txt. Więcej informacji znajdziesz poniżej.
Rozpoznawanie nazw DNS
Wykres pokazuje, kiedy serwer DNS nie rozpoznał Twojej nazwy hosta lub nie odpowiadał podczas indeksowania. Jeśli widzisz błędy, sprawdź u rejestratora domen, czy Twoja witryna jest poprawnie skonfigurowana i czy Twój serwer jest podłączony do internetu.
Połączenie z serwerem
Wykres pokazuje, kiedy serwer nie odpowiadał lub nie udzielał pełnej odpowiedzi dotyczącej adresu URL podczas indeksowania. Aby dowiedzieć się, jak naprawić te błędy, przeczytaj artykuł Błędy serwera.

Więcej informacji o dostępności pliku robots.txt

W tym miejscu opisujemy szczegółowo, w jaki sposób Google sprawdza pliki robots.txt podczas indeksowania Twojej witryny i do czego są one potrzebne.

Twoja witryna nie musi mieć pliku robots.txt, ale w odpowiedzi na jego żądanie musi zwracać prawidłową odpowiedź (opisaną poniżej) – w innym przypadku Google może przestać indeksować Twoją witrynę.

Prawidłowe odpowiedzi na żądanie pliku robots.txt
Wszystkie poniższe odpowiedzi są uznawane za prawidłowe:
- HTTP 200 i plik robots.txt (plik może być prawidłowy, nieprawidłowy lub pusty). Jeśli plik zawiera błędy składniowe, żądanie jest nadal uznawane za zrealizowane, ale Google może zignorować reguły, w których te błędy występują.
- HTTP 403/404/410 (plik nie istnieje). Twoja witryna nie musi mieć pliku robots.txt.
Nieprawidłowe odpowiedzi na żądanie pliku robots.txt
- HTTP 429/5XX (problem z połączeniem)

Jak Google wysyła żądania plików robots.txt i jak wykorzystuje te pliki podczas indeksowania witryny:

Przed zindeksowaniem Twojej witryny Google sprawdza najpierw, czy w ostatnim czasie (nie dawniej niż 24 godziny temu) zostało zrealizowane jakieś żądanie pliku robots.txt.
Jeśli odpowiedź na żądanie pliku robots.txt jest starsza niż sprzed 24 godzin, wykorzystamy ten plik podczas indeksowania Twojej witryny. Pamiętaj, że kod 404 – „Nie znaleziono” oznacza, że nie ma pliku robots.txt, więc Google może zindeksować wszystkie adresy URL w danej witrynie.
Jeśli ostatnia odpowiedź była nieudana lub pochodzi sprzed 24 godzin, Google żąda pliku robots.txt:
- Jeśli otrzyma prawidłową odpowiedź, rozpocznie indeksowanie.
- Jeśli otrzyma odpowiedź oznaczającą niepowodzenie:
  - Przez pierwsze 12 godzin Google przestanie indeksować Twoją witrynę, ale nadal będzie żądać pliku robots.txt.
  - Od 12 godziny do 30 dnia Google będzie używać ostatniego pobranego pliku robots.txt, nadal wysyłając żądanie dotyczące tego typu pliku.
  - Po 30 dniach:
    - Jeśli strona główna witryny będzie dostępna, Google będzie działać tak, jakby nie było pliku robots.txt, i będzie indeksować witrynę bez ograniczeń.
    - Jeśli strona główna witryny będzie niedostępna, Google przestanie ją indeksować.
    - W obu przypadkach Google będzie co jakiś czas wysyłać żądania pliku robots.txt.

Wszystkie indeksowania, które zostały porzucone, ponieważ plik robots.txt był niedostępny, są ujęte w sumach indeksowania. Te indeksowania nie zostały jednak zrealizowane, dlatego niektóre raporty grupujące (indeksowanie według celu, indeksowanie według odpowiedzi itd.) nie będą ich obejmować lub mogą zawierać ograniczone informacje na ich temat.

Odpowiedzi na żądania robota indeksującego

Ta tabela przedstawia odpowiedzi otrzymywane przez Google podczas indeksowania Twojej witryny, pogrupowane według typu odpowiedzi i wyrażone jako odsetek wszystkich odpowiedzi otrzymanych podczas indeksowania. Dane dotyczą całkowitej liczby żądań, a nie adresów URL, więc jeśli Google zażąda danego adresu URL dwukrotnie i otrzyma najpierw odpowiedź Błąd serwera (500), a potem OK (200), dane pokażą 50% odpowiedzi Błąd serwera i 50% odpowiedzi OK.

Na co zwrócić uwagę

Większość odpowiedzi powinny stanowić kody 200 lub inne prawidłowe odpowiedzi, chyba że zmieniasz organizację witryny lub ją przenosisz. Zapoznaj się z poniższą listą, by dowiedzieć się, jak postępować w przypadku innych kodów odpowiedzi.

Oto kilka typowych kodów odpowiedzi i sposób postępowania z nimi:

Prawidłowe kody odpowiedzi

Strony działają prawidłowo i nie powodują żadnych problemów.

OK (200): w normalnych okolicznościach kody 200 powinny stanowić większość odpowiedzi.
Przeniesiono na stałe (301): strona zwraca odpowiedź HTTP 301 lub 308 (przeniesiono na stałe) – co prawdopodobnie zostało przez Ciebie zaplanowane.
Przeniesiono tymczasowo (302): strona zwraca odpowiedź HTTP 302 lub 307 (przeniesiono tymczasowo) – co prawdopodobnie zostało przez Ciebie zaplanowane. Jeśli ta strona została trwale przeniesiona, zmień odpowiedź na 301.
Przeniesiono (inne): metaodświeżanie.
Nie zmodyfikowano (304): strona nie zmieniła się od ostatniego żądania indeksowania.

Prawdopodobnie prawidłowe kody odpowiedzi

Te odpowiedzi mogą być prawidłowe, ale lepiej to sprawdzić.

Błędy Nie znaleziono (404) mogą występować z powodu uszkodzonych linków w Twojej witrynie lub poza nią. Nie da się naprawić wszystkich występujących w witrynie błędów 404 i wcale nie jest to zalecane. Często błędy 404 to zamierzona odpowiedź (jeśli na przykład strona rzeczywiście została usunięta, a w jej miejsce nie dodano innej). Dowiedz się, czy i jak naprawiać błędy 404

Nieprawidłowe kody odpowiedzi

Napraw strony, które zwracają te błędy, by poprawić indeksowanie.

Plik robots.txt jest niedostępny: jeśli plik robots.txt będzie danego dnia niedostępny, Google wstrzyma indeksowanie do czasu otrzymania prawidłowej odpowiedzi na żądanie pliku robots.txt. Pamiętaj, aby nie maskować pliku robots.txt dla Google ani nie zmieniać strony pliku robots.txt w zależności od klienta użytkownika.
Ta odpowiedź różni się od zwracania w przypadku pliku robots.txt kodu „Nie znaleziono (404)”, który jest uznawany za prawidłową odpowiedź. Więcej informacji o pliku robots.txt
Brak autoryzacji (401/407): zablokuj indeksowanie tych stron za pomocą pliku robots.txt lub określ, czy powinny zostać odblokowane. Jeśli te strony nie mają zabezpieczonych danych i chcesz, by były indeksowane, możesz przenieść te dane na niezabezpieczone strony lub zezwolić Googlebotowi na dostęp bez logowania (pamiętaj jednak, że ktoś może się podszyć pod Googlebota, więc w praktyce zezwolenie Googlebotowi na dostęp bez logowania usuwa zabezpieczenia strony).
Błąd serwera (5XX): te błędy powodują ostrzeżenia dotyczące dostępności i jeśli to możliwe, powinny zostać usunięte. Na miniaturowym wykresie widać, kiedy mniej więcej te błędy wystąpiły. Kliknij, by zobaczyć szczegóły i dokładne godziny. Ustal, czy były to przejściowe błędy czy poważniejsze problemy z dostępnością witryny. Jeśli Google zbyt często indeksuje Twoją witrynę, możesz poprosić o zmniejszenie częstotliwości indeksowania. Jeśli wskazuje to na poważny problem związany z dostępnością, przeczytaj informacje o skokach częstotliwości indeksowania. Aby dowiedzieć się, jak naprawić te błędy, przeczytaj artykuł Błędy serwera.
Inny błąd klienta (4XX): inne błędy 4XX (po stronie klienta), które nie zostały tutaj wymienione. Najlepiej jest je naprawić.
DNS nie odpowiada: Twój serwer DNS nie odpowiadał na żądania dotyczące adresów URL w Twojej witrynie.
Błąd DNS: inny, nieokreślony błąd DNS.
Błąd pobierania: strony nie udało się pobrać z powodu błędnego numeru portu lub adresu IP albo niemożliwej do przeanalizowania odpowiedzi.
Nie można otworzyć strony: jakikolwiek inny napotkany podczas pobierania strony błąd, w wyniku którego żądanie nie dotarło do serwera. Takie żądania nie docierają do serwera, więc nie pojawiają się w dziennikach.
Czas oczekiwania na odpowiedź strony: upłynął limit czasu oczekiwania na odpowiedź strony na żądanie.
Błąd przekierowania: błąd przekierowania żądania, np. zbyt wiele przekierowań, przekierowanie puste lub przekierowanie z powrotem na tę samą stronę.
Inny błąd: inny błąd, który nie pasuje do żadnej z powyższych kategorii.

Typy indeksowanych plików

Typ pliku zwracany w odpowiedzi na żądanie. Procentowa wartość każdego typu pliku to odsetek odpowiedzi obejmujących tego typu plik, a nie odsetek liczby pobranych bajtów tego typu plików.

Możliwe wartości typów plików:

HTML;
obraz;
wideo – 1 z obsługiwanych formatów wideo;
JavaScript;
CSS;
PDF;
inne pliki XML – dowolne pliki XML z wyjątkiem plików RSS, KML i innych formatów utworzonych na podstawie kodu XML;
JSON;
dystrybucja – kanał RSS lub Atom;
audio;
dane geograficzne – KML lub inne dane geograficzne;
inny typ pliku – inny, niewymieniony tutaj typ pliku (ta grupa uwzględnia przekierowania);
nieznany (niepowodzenie) – jeśli żądanie nie zostało zrealizowane, typ pliku nie jest znany.

Na co zwrócić uwagę

Jeśli zauważysz problemy z dostępnością lub niski wskaźnik odpowiedzi, sprawdź w tej tabeli, jakie rodzaje zasobów indeksuje Google i co może spowalniać indeksowanie Twojej witryny. Czy Google żąda wielu małych obrazów, które powinny być zablokowane? Czy Google żąda zasobów hostowanych w innej, mniej elastycznej witrynie? Klikaj poszczególne typy plików, by zobaczyć wykres średniego czasu odpowiedzi według daty oraz liczby żądań według daty. W ten sposób sprawdzisz, czy nagły wzrost liczby spowolnionych odpowiedzi danego typu odpowiada nagłemu wzrostowi przypadków ogólnego spowolnienia lub niedostępności.

Cel indeksowania

Wykrycie: żądany adres URL nie został nigdy wcześniej zindeksowany przez Google.
Odświeżenie: ponowne zindeksowanie znanej strony.

Jeśli często wprowadzasz zmiany na stronach, które nie są dość często ponownie indeksowane, upewnij się, że znajdują się one na mapie witryny. W przypadku rzadziej aktualizowanych stron konieczne może być wysłanie prośby o ponowne zindeksowanie. Jeśli zdarzyło Ci się niedawno dodać wiele nowych treści lub przesłać mapę witryny, częstotliwość indeksowania pod kątem wykrycia nowych stron w Twojej witrynie powinna wzrosnąć.

Typ Googlebota

Typ klienta użytkownika użytego do wysłania żądania indeksowania. Google ma wiele klientów użytkownika, które indeksują z różnych powodów i różnie się zachowują.

Możliwe wartości typu Googlebota:

Smartfon: Googlebot indeksujący strony na smartfony
Komputer: komputerowy Googlebot
Obraz: Googlebot indeksujący obrazy. Jeśli obraz jest wczytywany jako zasób strony, zliczany typ Googlebota to Ładowanie zasobu strony, a nie Obraz.
Wideo: Googlebot indeksujący filmy. Jeśli film jest wczytywany jako zasób strony, zliczany typ Googlebota to Ładowanie zasobu strony, a nie Wideo.
Ładowanie zasobu strony: dodatkowe pobieranie zasobów używanych przez stronę. Podczas skanowania strony Google pobiera ważne powiązane linkami zasoby, takie jak obrazy lub pliki CSS, by przed zindeksowaniem ją wyrenderować. Ładowanie zasobu strony to klient użytkownika, który wysyła żądania tych zasobów.
AdsBot: jeden z robotów AdsBot. Jeśli widzisz gwałtowny wzrost liczby tego typu żądań, prawdopodobnie w Twojej witrynie zostały niedawno utworzone nowe cele dotyczące dynamicznych reklam w wyszukiwarce. Zobacz artykuł Dlaczego szybkość indeksowania mojej witryny nagle wzrosła?. AdsBot indeksuje adresy URL mniej więcej co 2 tygodnie.
StoreBot: robot indeksujący produkty do kupienia.
Inny typ klienta: inny, niewymieniony tutaj robot Google.

Jeśli zauważysz skoki indeksowania, sprawdź, jaki typ klienta użytkownika wysyła żądania. Jeśli wygląda na to, że wysyła je robot AdsBot, przeczytaj artykuł Dlaczego częstotliwość indeksowania mojej witryny nagle wzrosła?.

Rozwiązywanie problemów

Zbyt duża szybkość indeksowania

Googlebot używa algorytmów, które uniemożliwiają przeciążenie Twojej witryny w trakcie indeksowania. Jeśli jednak z jakiegoś powodu chcesz ograniczyć szybkość indeksowania, dowiedz się, jak możesz to zrobić.

Dlaczego szybkość indeksowania mojej witryny nagle wzrosła?

Jeśli umieścisz w witrynie sporo nowych informacji lub są one bardzo przydatne dla użytkowników, Googlebot może indeksować Twoją witrynę częściej, niż uznasz to za konieczne. Przykład:

Z dużej części witryny usunięto blokadę indeksowania.
Do witryny została dodana duża sekcja.
Dodanie nowych plików z adresami stron docelowych lub reguł URL_Equals spowodowało pojawienie się wielu nowych celów dotyczących dynamicznych reklam w wyszukiwarce.

Zobacz, jak możesz chronić swoją witrynę, jeśli jest indeksowana tak często, że występują problemy z jej dostępnością:

Sprawdź, który robot Google zbyt często indeksuje Twoją witrynę. Przejrzyj dzienniki witryny lub skorzystaj z raportu Statystyki indeksowania.
Pomoc doraźna:
- Jeśli szukasz prostego rozwiązania, użyj pliku robots.txt, aby zablokować indeksowanie przez element, który powoduje przeciążenia (googlebota, adbota itp.). Może to zająć nawet cały dzień. Nie blokuj ich jednak na zbyt długo, ponieważ może to mieć długoterminowy wpływ na indeksowanie.
- Jeśli możesz dynamicznie wykrywać zwiększone obciążenie i na nie reagować, zwracaj błędy HTTP 503/429, gdy zbliżasz się do limitu serwera. Pamiętaj, aby nie zwracać tych błędów przez okres dłuższy niż 2 lub 3 dni, bo może to sprawić, że witryna na stałe będzie rzadziej indeksowana przez Google.
Po upływie 2 lub 3 dni, gdy szybkość indeksowania przez Google zostanie dostosowana, możesz usunąć blokujące pliki robots.txt lub przestać zwracać kody błędów 503 lub 429.
Jeśli Twoja witryna jest przeciążona żądaniami indeksowania przez robota AdsBot, przyczyną problemu jest prawdopodobnie utworzenie przez Ciebie w witrynie zbyt wielu celów dynamicznych reklam w wyszukiwarce przy użyciu metody URL_Equals lub plików z adresami stron docelowych. Jeśli Twój serwer nie poradzi sobie z obsługą tych indeksowań, ogranicz cele reklam, dodaj adresy URL w mniejszych partiach lub zwiększ możliwości serwera. AdsBot będzie indeksować Twoje strony co 2 tygodnie, dlatego musisz rozwiązać ten problem, bo inaczej będzie się powtarzał.

Szybkość indeksowania wydaje się za mała

Nie możesz poprosić Google o zwiększenie szybkości indeksowania. Możesz jednak dowiedzieć się więcej o zarządzaniu indeksowaniem bardzo dużych lub często aktualizowanych witryn.

Jeśli masz małą lub średnią witrynę i zauważysz, że Google nie indeksuje jej w całości, zaktualizuj mapy witryny i upewnij się, że nie blokujesz żadnych stron.

Dlaczego szybkość indeksowania mojej witryny spadła?

Z reguły szybkość indeksowania powinna utrzymywać się na stałym poziomie w okresie jednego lub dwóch tygodni. Nagły spadek może wynikać z następujących powodów:

Dodałeś nową (lub bardzo ogólną) regułę w pliku robots.txt. Upewnij się, że zablokowane są tylko właściwe zasoby. Jeśli Googlebot potrzebuje do odczytania treści odpowiednich zasobów – takich jak arkusze CSS czy kod JavaScript – upewnij się, że ma do nich dostęp.
Jeśli witryna wolno reaguje na prośby, Googlebot będzie przesyłać ich mniej, by nie przeciążać jej serwera. Sprawdź w raporcie o statystykach indeksowania, czy Twoja witryna ostatnio wolniej odpowiadała na prośby.
Jeśli zwiększyła się liczba błędów serwera, Googlebot będzie przesyłać mniej próśb, by nie przeciążać serwera witryny.
Jeśli witryna zawiera informacje, które niezbyt często się zmieniają lub ich jakość nie jest bardzo wysoka, Googlebot może ją indeksować rzadziej. Przyjrzyj się zawartości swojej witryny, zasięgnij opinii osób, które nie są z nią związane, i zastanów się, jak ją ulepszyć.

Sumy indeksowania podane w raportach są znacznie wyższe niż sumy z dzienników serwera Twojej witryny

Jeśli łączna liczba indeksowań widoczna w tym raporcie jest znacznie większa niż liczba żądań indeksowania Google w dziennikach serwera, wynika to prawdopodobnie stąd, że Google nie może zindeksować witryny, bo zbyt długo nie ma dostępu do pliku robots.txt. W takiej sytuacji Google nie wysyła żądań związanych z indeksowaniem, jednak liczy indeksowania, które mogłyby zostać zrealizowane, gdyby plik robots.txt był dostępny. Sprawdź stan pobierania pliku robots.txt, by zobaczyć, czy w Twoim przypadku występuje ten problem.

Czy to było pomocne?

Jak możemy ją poprawić?

Raport Statystyki indeksowania

Pierwsze kroki

Informacje o danych

Poruszanie się po raporcie

Hosty i domeny podrzędne

Przykładowe adresy URL

Łączna liczba żądań robota indeksującego

Całkowity rozmiar pobierania

Średni czas odpowiedzi

Stan hosta

Informacje o stanie hosta

Odpowiedzi na żądania robota indeksującego

Prawidłowe kody odpowiedzi

Prawdopodobnie prawidłowe kody odpowiedzi

Nieprawidłowe kody odpowiedzi

Typy indeksowanych plików

Cel indeksowania

Typ Googlebota

Rozwiązywanie problemów

Zbyt duża szybkość indeksowania

Dlaczego szybkość indeksowania mojej witryny nagle wzrosła?

Szybkość indeksowania wydaje się za mała

Dlaczego szybkość indeksowania mojej witryny spadła?

Sumy indeksowania podane w raportach są znacznie wyższe niż sumy z dzienników serwera Twojej witryny

Czy to było pomocne?

Potrzebujesz dodatkowej pomocy?

Wykonaj te czynności: