Wiadomości Google używają specjalnego algorytmu do indeksowania witryn z wiadomościami. Aby nasz system mógł ustalić, które strony zawierają artykuły, Twoja witryna powinna spełniać te wymagania techniczne.
Wytyczne dotyczące struktury strony
Zalecamy wydawcom postępowanie zgodnie z poniższymi wytycznymi na temat struktury witryny, by ułatwić prawidłowe indeksowanie nowych treści.
Stałe strony sekcji
Jeśli adresy URL głównych sekcji wiadomości zmieniają się często, możemy nie być w stanie odpowiednio odczytać informacji o witrynie. Niestałość adresów URL uniemożliwia znajdowanie nowych treści, ponieważ roboty nie są w stanie ustalić najbardziej aktualnych adresów, które mają być indeksowane.
Nasz robot Googlebot-News sprawdza się najlepiej, gdy adresy URL głównych sekcji wiadomości się nie zmieniają. Googlebot-News najlepiej radzi sobie z indeksowaniem linków HTML. Nie jest w stanie indeksować linków graficznych ani umieszczonych w kodzie JavaScript. Upewnij się, że artykuły na stronach sekcji mają tylko linki HTML.
Upewnij się też, że tekst kotwicy wskazujący artykuł ze strony z sekcjami zgadza się z tytułem artykułu i strony. Jeśli spełnienie tych wymagań technicznych sprawia Ci kłopoty, możesz użyć indeksowania tylko map witryn. Skontaktuj się z naszym zespołem, jeśli chcesz wypróbować ten sposób.
Dostępność treści
Aby treści z Twojej witryny pojawiły się w Wiadomościach Google, nasz robot musi mieć do nich dostęp. Upewnij się, że katalogi, w których są hostowane artykuły, nie są blokowane przy użyciu pliku robots.txt. Zadbaj też o to, by metatagi i specyfikacje nagłówków nie blokowały dostępu do linków do artykułów. Wiadomości Google prowadzą indeksowanie przy użyciu tego samego robota co wyszukiwarka Google – jest to Googlebot.
-
Jeśli uważasz, że plik robots.txt, metatagi albo specyfikacje nagłówka HTML blokują naszego robota, przeczytaj artykuł o zarządzaniu dostępem do treści w witrynie.
Wymagania dotyczące języków i kodowania
Zrozumienie naszych wskazówek związanych z językami treści i kodowaniem strony jest bardzo ważne.
Język
Wiadomości Google nie pokazują stron z artykułami, w których użyto więcej niż jednego języka. Nasz system ma problem z analizowaniem treści zawierających wiele języków, przez co trudno jest mu wyświetlać materiały w odpowiednim języku.
Jeśli w Twojej witrynie są sekcje w określonych językach, np. example.com/francuski lub example.com/angielski, utwórz odrębne publikacje dla każdego z języków. Dzięki temu użytkownicy będą widzieli treści w języku, który znają. Więcej informacji o konfigurowaniu publikacji
Kodowanie strony
Koduj stronę w formacie UTF-8. Więcej informacji o kodowaniu znajdziesz na stronie www.w3.org.
Wymagania związane ze stronami z artykułami
Ponieważ chcemy mieć pewność, że indeksujemy tylko właściwe artykuły, prosimy o przestrzeganie kilku wymagań dotyczących stron z artykułami. Zalecamy postępowanie zgodnie z tymi wskazówkami.
Adresy URL artykułów
Adresy URL Twoich artykułów są unikalne i stałe.
-
Unikalne adresy URL: każda strona zawierająca pełną treść artykułu musi mieć unikalny adres URL. W Wiadomościach Google nie akceptujemy witryn, w których wiele artykułów znajduje się pod jednym adresem URL, ani takich, które nie mają linków do stron poświęconych poszczególnym artykułom.
- Stałe adresy URL: aby nasze linki do artykułów działały, każdy artykuł w Twojej witrynie z wiadomościami musi być powiązany ze stałym i unikalnym adresem URL. Na przykład nie byłoby możliwe indeksowanie strony www.twojawitryna.com/wiadomosc1.html, gdyby każdego dnia była na niej wyświetlana inna historia.
Ważne: nie publikuj ponownie artykułów pod nowym adresem URL.
Jeśli artykuł zostanie później opublikowany ponownie, jego adres URL się nie zmieni. Jeśli na przykład początkowo artykuł był już opublikowany na www.example.com/wiadomosc1.html, nie zostanie później opublikowany ponownie na www.example.com/wiadomosc2.html. Jeśli w procesie zmiany domen lub struktury systemu zarządzania treścią zmienił się Twój wzorzec adresu URL, prześlij nam reguły transformacji wzorca. Możemy pomóc w tych zmianach.
Wskazówki dotyczące układu strony
Nagłówki i czas publikacji artykułu powinny być łatwe do zidentyfikowania przez naszego robota. Strony z artykułami powinny używać formatu HTML, a tekstu nie należy umieszczać w kodzie JavaScript.