Nicht gecrawlter Artikel

Beim Lesen Tausender von Websites pro Minute kann es passieren, dass der Google News-Crawler einige wenige Artikel nicht erfasst. Wenn Sie feststellen, dass Google News einige Ihrer neuesten Artikel nicht aufgenommen hat, gibt es dafür sicherlich eine ganz einfache Lösung.

Wahrscheinlich hindert uns ein bestimmtes technisches Problem daran, Ihre Inhalte aufzunehmen. Folgen Sie den nachstehenden Schritten, um herausfinden, woran es liegen könnte, dass unser System Ihre Inhalte nicht liest.

  1. Überprüfen Sie zuallererst, welche Artikel Ihrer Website Google News zurzeit crawlt. Dies lässt sich am schnellsten feststellen, indem Sie auf der Google News-Startseite Neues Fenster den Operator site: zusammen mit Ihrem Domainnamen eingeben. Wenn Sie beispielsweise nach Artikeln aus den XY Nachrichten suchen, geben Sie in das Suchfeld site:XY.de ein.
  2. Wenn die Artikel mit einem anderen Veröffentlichungsnamen angezeigt werden oder mit einer veralteten Website-Domain verlinkt sind, kann es gut sein, dass die Informationen, die wir in unserem System über Ihre Inhalte haben, veraltet sind und die Inhalte deswegen nicht gecrawlt werden. Dies lässt sich ganz leicht beheben, indem Sie unserem Team eine Aktualisierung melden.
  3. Wenn die Informationen Ihrer Website in den Suchergebnissen richtig erscheinen, suchen Sie nach einigen Artikeln, die Google News nicht erfasst hat. Überprüfen Sie diese Artikel auf die Erfüllung unserer technischen Anforderungen. Die folgenden Probleme, die das Crawling von Artikeln verhindern, treten immer wieder auf:
    • Die Artikel-URLs sind nicht eindeutig oder umfassen nicht genügend Ziffern.
    • Der Crawler kann nicht auf Artikel zugreifen, weil sie entweder durch eine robots.txt-Datei oder durch Meta-Tags blockiert werden.
    • Die Inhalte werden nicht auf der Haupt-Domain der Website, sondern auf einer Domain gehostet, die nicht in unserem System aufgeführt ist.
    • Der Crawler kann das Datum oder den Titel Ihres Artikels nicht bestimmen.
    • Die Artikelseiten enthalten dynamischen Inhalt, den unser Crawler nicht lesen kann.
    • Die Artikel scheinen nicht genug Text zu enthalten, um aufgenommen zu werden.
    Wenn Sie vermuten, dass eines der obigen Probleme auf Ihre Website zutrifft, versuchen Sie, das Problem zu lösen, indem Sie überprüfen, ob Ihre Website unseren Technischen Anforderungen entspricht.
  4. Bei allen oben angeführten Problemen empfehlen wir Ihnen, eine Google News-Sitemap einzureichen. Sitemaps können das Suchen des Crawlers nach Ihren Inhalten beschleunigen und Probleme lösen, die durch fehlerhafte Überschriften und Veröffentlichungsdaten hervorgerufen wurden. Beachten Sie, dass sich Google News-Sitemaps von denen der Google Websuche unterscheiden.
  5. Wenn Sie nach dem Einreichen Ihrer Sitemap feststellen, dass Google News immer noch mehrere Ihrer Artikel nicht erfasst, prüfen Sie in Ihrem Webmaster-Tools-Konto den Status der Website. Klicken Sie zunächst auf Crawling-Fehler und dann auf News-spezifische Crawling-Fehler, um zu sehen, welche Artikel Ihrer Website Google News nicht indizieren kann. Lesen Sie die gesamte Beschreibung unserer Crawling-Fehler bei Google News durch, wenn Sie weitere Hilfe bei der Fehlerbehebung benötigen.
  6. Außer mit dem Tool für Crawling-Fehler können Sie auch versuchen, das Problem über die Option Abruf wie durch Googlebot in Ihrem Webmaster-Tools-Konto zu lösen. Mithilfe dieses Tools sehen Sie Ihre Website genauso wie die Crawler von Google. Dies könnte Ihnen Aufschluss darüber geben, warum unser System Ihre Inhalte nicht indizieren kann. Weitere Informationen zur Verwendung dieses Tools finden Sie in der Hilfe für Webmaster Neues Fenster.

Eine weitere Möglichkeit wäre das Google News-Hilfeforum Neues Fenster, in dem Publisher nützliche Tipps und Erfahrungen austauschen.

Wenn Sie festgestellt haben, warum Google News einige Ihrer Artikel nicht crawlt, oder wenn Sie weitere Fragen haben, senden Sie uns die URLs der Artikel, die nicht gecrawlt werden. Beachten Sie bitte, dass wir die nicht Aufnahme aller Inhalte garantieren können. Wir tun aber unser Bestes, um möglichst viele Ihrer Artikel zu crawlen.