Jak Google indeksuje strony o treści zależnej od języka

Jeśli w Twojej witrynie są strony z zawartością zależną od języka (czyli takie, których treści zależą od wykrytego kraju lub preferowanego języka użytkownika), Google może nie skanować, nie indeksować ani nie uwzględniać w rankingu wszystkich Twoich treści kierowanych na różne języki. Dzieje się tak dlatego, że domyślne adresy IP Googlebota wyglądają na zlokalizowane w USA. Dodatkowo robot wysyła żądania HTTP bez ustawienia atrybutu Accept-Language w nagłówku żądania.

Indeksowanie geograficzne

Oprócz adresów IP zlokalizowanych w Stanach Zjednoczonych robot Googlebot do indeksowania stron stosuje adresy IP odczytywane jako znajdujące się w innych krajach.

Zgodnie z naszymi stałymi zaleceniami, gdy wydaje się, że Googlebot pochodzi z określonego kraju, należy go traktować tak, jak każdego użytkownika z tego kraju. Oznacza to, że jeśli blokujesz dostęp do swoich treści użytkownikom z USA, ale zezwalasz na dostęp użytkownikom z Australii, Twój serwer powinien blokować Googlebota, który sprawia wrażenie, że pochodzi z USA, ale zezwalać na dostęp temu, który jak się wydaje, pochodzi z Australii.

Inne uwagi

Googlebot używa tego samego ciągu znaków agenta użytkownika we wszystkich konfiguracjach indeksowania. Dowiedz się więcej o ciągach znaków powiązanych z klientami użytkownika używanymi przez roboty Google.
Możesz zweryfikować indeksowanie geograficzne wykonywane przez Googlebota za pomocą odwrotnych wyszukiwań DNS.
Upewnij się, że Twoja witryna korzysta z Robots Exclusion Protocol spójnie dla wszystkich języków. Oznacza to, że tagi meta robots oraz plik robots.txt muszą zawierać te same reguły w przypadku każdego języka.