Technische Richtlinien

Google verwendet einen Computeralgorithmus, um Nachrichtenwebsites zu crawlen. Achten Sie darauf, dass diese technischen Richtlinien auf Ihrer Website eingehalten werden. So kann unser System besser erkennen, welche Ihrer Webseiten tatsächlich Nachrichtenartikel enthalten.

Technische Anforderungen an die Websitestruktur

Google News empfiehlt Verlagen und Webpublishern, die folgenden Richtlinien zur Websitestruktur umzusetzen, damit neue Inhalte ordnungsgemäß gecrawlt werden können.

Dauerhafte Bereichsseiten

Wenn sich die URLs in Ihren Hauptnachrichtenbereichen häufig ändern, kann Google News Ihre Website möglicherweise nicht lesen. Nicht dauerhafte URLs verhindern das Crawlen neuer Inhalte, da wir die aktuelle URL für das Crawling nicht erfassen können.

Unser automatisierter Crawler, Googlebot-News, funktioniert am besten, wenn die URLs Ihrer Hauptnachrichtenbereiche gleich bleiben. Am besten kann er HTML-Links crawlen. Bildlinks oder in JavaScript eingebettete Links kann er nicht crawlen. Achten Sie also darauf, dass alle Artikel auf Ihren Bereichsseiten nur HTML-Links enthalten.

Außerdem muss der Ankertext, der auf Ihren Artikel auf den Bereichsseiten verweist, mit dem Titel Ihres Artikels und dem Seitentitel übereinstimmen. Falls diese technischen Anforderungen ein Problem für Sie darstellen, kann eine mögliche Lösung das Crawlen nur über Sitemaps sein. Wenn Sie Ihre Website ausschließlich über Sitemaps crawlen lassen möchten, wenden Sie sich an unser Team.

Zugängliche Inhalte

Unser Crawler muss auf Ihre Website zugreifen, um Ihre Inhalte in Google News aufzunehmen. Die Verzeichnisse, die Ihre Artikel beinhalten, dürfen nicht durch eine robots.txt-Datei und Meta-Tags blockiert sein. Außerdem darf der Zugriff auf Ihre Artikellinks nicht durch Header-Spezifikationen unterbunden sein. Google News verwendet zum Crawling den gleichen Robot wie die Google Websuche, nämlich den Googlebot.

  • Wenn Sie vermuten, dass die robots.txt-Datei, die Meta-Tags oder die HTML-Header-Spezifikationen Ihrer Website den Crawler am Zugriff auf Ihre Inhalte hindern, lesen Sie den Hilfeartikel Zugriff auf Inhalte Ihrer Website verwalten.

Anforderungen für Sprachen und Codierung

Unsere Richtlinien für die Sprache und Codierung der Inhalte Ihrer Website spielen eine wichtige Rolle, weshalb Sie sich mit ihnen vertraut machen sollten.

Sprache

Google News berücksichtigt keine Websites mit Artikeln, die mehrere Sprachen enthalten. Unser System hat Probleme bei der Analyse von Inhalten, die mehrere Sprachen enthalten. Außerdem erschwert dieser Umstand die Darstellung der Inhalte in der richtigen Sprache.

Wenn Ihre Website Bereiche für bestimmte Sprachen hat, etwa example.com/fr für Französisch und example.com/en für Englisch, dann erstellen Sie separate Publikationen für die einzelnen Sprachen. Damit gewährleisten Sie, dass Nutzern Inhalte in ihrer Sprache angezeigt werden. Informationen dazu, wie Sie eine Publikation einrichten

Website codieren

Die besten Ergebnisse erzielen Sie, wenn Ihre Website in UTF-8 codiert ist. Weitere Informationen zur Codierung finden Sie unter www.w3.org.

Anforderungen an Artikelseiten

Wenn Sie möchten, dass nur Ihre Nachrichtenartikel gecrawlt werden, müssen Sie die in Google News geltenden Anforderungen an Artikelseiten erfüllen. Gehen Sie die Schritte unten durch, um sicherzugehen, dass Sie die Richtlinien erfüllen.

Artikel-URLs

Die URLs Ihrer Artikel müssen eindeutig sein und dauerhaft gelten:

  • Eindeutige URLs: Alle Seiten, auf denen der vollständige Text eines Artikels angezeigt wird, benötigen eine eindeutige URL. Websites, auf denen mehrere Artikel unter derselben URL angezeigt werden oder die keine Links zu einzelnen Artikelseiten haben, können nicht in Google News aufgenommen werden.

  • Dauerhafte URLs: Unsere Links zu Artikeln funktionieren nur dann, wenn alle Artikel auf einer Nachrichtenwebsite einer dauerhaften URL, die für jeden Artikel eindeutig ist, zugeordnet sind. Beispielsweise können wir die Seite www.yoursite.com/nachrichten1.html nicht crawlen, wenn dort jeden Tag eine andere Meldung angezeigt wird.


Wichtig: Sie sollten vorher veröffentlichte Artikel nicht noch einmal unter einer neuen URL veröffentlichen.

Wenn ein Artikel später noch einmal veröffentlicht wird, ändert sich seine URL nicht. Wenn beispielsweise ein Artikel zuerst unter www.example.com/nachrichten1.html veröffentlicht wurde, wird er nicht noch einmal unter www.example.com/nachrichten2.html veröffentlicht. Falls sich beim Ändern von Domains oder der CMS-Struktur auch das URL-Muster ändert, senden Sie uns Ihre Mustertransformationsregeln. Wir können Ihnen bei diesen Musteränderungen helfen.

Technische Anforderungen an das Seitenlayout

Die Überschriften Ihrer Artikel und der Zeitpunkt ihrer Veröffentlichung müssen von unserem automatisierten Crawler leicht erkannt werden können. Ihre Artikelseiten müssen im HTML-Format vorliegen und der Textkörper darf nicht in JavaScript eingebettet sein.

War das hilfreich?
Wie können wir die Seite verbessern?