Jak Google indeksuje strony o treści zależnej od języka

Jeśli Twoja witryna ma strony o treści zależnej od języka (czyli zwraca różne treści, zależnie od wykrytego kraju lub preferowanego języka użytkownika), Google może nie skanować, nie indeksować ani nie uwzględniać w rankingu Twoich wszystkich treści kierowanych na różne języki. Dzieje się tak dlatego, że domyślne adresy IP Googlebota wyglądają na zlokalizowane w USA. Dodatkowo robot wysyła żądania HTTP bez ustawienia atrybutu Accept-Language w nagłówku żądania.

WAŻNE: zalecamy korzystanie z oddzielnych konfiguracji adresów URL dla osobnych języków i dodawanie do nich adnotacji rel=alternate hreflang.

 

Indeksowanie geograficzne

Oprócz adresów IP zlokalizowanych w Stanach Zjednoczonych robot Googlebot do indeksowania stron stosuje adresy IP odczytywane jako znajdujące się poza ich terenem.

Zgodnie z naszymi stałymi zaleceniami, gdy wydaje się, że Googlebot pochodzi z określonego kraju, należy go traktować tak, jak każdego użytkownika z tego kraju. Oznacza to, że jeśli blokujesz dostęp do swoich treści użytkownikom z USA, ale zezwalasz na dostęp użytkownikom z Australii, Twój serwer powinien blokować Googlebota, który sprawia wrażenie, że pochodzi z USA, ale zezwalać na dostęp temu, który jak się wydaje, pochodzi z Australii.

Inne uwagi

  • Googlebot używa tego samego ciągu znaków agenta użytkownika we wszystkich konfiguracjach indeksowania. Dowiedz się więcej na temat ciągów znaków agentów użytkownika stosowanych przez roboty Google w naszym Centrum pomocy.
  • Możesz zweryfikować indeksowanie geograficzne wykonywane przez Googlebota za pomocą wstecznych wyszukiwań DNS.
  • Upewnij się, że Twoja witryna korzysta z protokołu wyłączenia robotów spójnie dla wszystkich języków. Oznacza to, że metatagi robotów oraz plik robots.txt powinny zawierać te same instrukcje w przypadku każdego języka.
Czy to było pomocne?
Jak możemy ją poprawić?