Crawling-Fehler in Google News

Verlage und Webpublisher, die Nachrichten veröffentlichen, können sich speziell für Google News Fehlerberichte anzeigen lassen, wenn ihre Website bei Google News registriert ist, sie über ein Webmaster-Tools-Konto verfügen und ihre Website zu ihrem Konto hinzugefügt haben. Setzen Sie sich mit uns in Verbindung, um die Aufnahme in Google News zu beantragen. Führen Sie anschließend die folgenden Schritte aus:

  • Klicken Sie auf der Startseite auf die URL der Website.
  • Klicken Sie auf dem Dashboard auf Crawling > Crawling-Fehler.
  • Klicken Sie auf den Tab "News", um sich die Crawling-Fehler für Ihre Nachrichten anzusehen.
  • Crawling-Fehler werden in Kategorien eingeteilt, etwa "Artikelextraktion" oder "Fehler im Titel". Wenn Sie auf eine dieser Kategorien klicken, erscheint eine Liste betroffener URLs zusammen mit den entsprechenden Crawling-Fehlern, die sie verursachen.
  • Crawling-Fehler in Google News sind beispielsweise die folgenden:

    Artikel ist unverhältnismäßig kurz

    Erläuterung

    Der von uns aus der HTML-Seite extrahierte Artikeltext ist im Vergleich zu anderen linkfreien Texten auf der Seite zu kurz. Dies gilt für die meisten Seiten, die Kurznachrichten oder Multimedia-Inhalte anstatt vollständiger Nachrichtenartikel enthalten. Dieser Fehler wurde generiert, um einen möglicherweise fehlerhaften Text auszuschließen.

    Empfehlungen

    Dieses Problem tritt oft aus den folgenden Gründen auf:

    • Zu viele Snippets für verwandte Artikel – Unser Extrahierer würde besser funktionieren, wenn Sie diese Snippets klickbar machen.
    • Funktionen wie "Diesen Artikel an Freunde senden" mit langen Beschreibungen – Zur Vermeidung des Fehlers können Sie die Stile "display:none" oder "visibility:hidden" einstellen, damit der Text unsichtbar wird, oder den HTML-Code von JavaScript dynamisch schreiben lassen.
    • Nutzerkommentare – Zur Vermeidung des Fehlers können Sie die Kommentare in einen iFrame einbetten, sie dynamisch mit AJAX abrufen oder sie auf eine angrenzende Seite verlagern.

    Falls der Fehler durch keinen dieser Vorschläge behoben wird, teilen Sie uns dies bitte mit.

    Artikel fragmentiert

    Erläuterung

    Der von uns aus der HTML-Seite extrahierte Artikeltext besteht aus einzelnen Sätzen, die nicht in Abschnitte gegliedert sind. Dieser Fehler wurde generiert, um einen möglicherweise fehlerhaften Text auszuschließen.

    Empfehlungen

    • Achten Sie darauf, dass jeder Absatz mehr als einen Satz enthält.
    • Achten Sie auf korrekte Zeichensetzung.
    • Verwenden Sie innerhalb der Absätze nicht häufig die Tags <br> und <p> und vermeiden Sie es allgemein, den Artikeltext in zu viele kleine Teile zu gliedern.
    • Sie haben auch die Möglichkeit, einen Teil des Textes, der nicht zum Artikel gehört, von der Artikelseite zu entfernen.

    Falls der Fehler durch keinen dieser Vorschläge behoben wird, teilen Sie uns dies bitte mit.

    Artikel zu lang

    Erläuterung

    Der von uns aus der HTML-Seite extrahierte Artikeltext ist zu lang für einen Nachrichtenartikel. Dieser Fehler wurde generiert, um einen möglicherweise fehlerhaften Text auszuschließen. Häufig handelt es sich hierbei um Nachrichtenartikel mit Nutzerkommentaren unter dem Artikel oder um HTML-Layouts, die weiteres Material außer dem Artikel selbst enthalten.

    Empfehlungen

    Um den Fehler zu vermeiden, können Sie einen Teil des Textes, der nicht zum Artikel gehört, von der Artikelseite entfernen. Wenn die Artikelseite Nutzerkommentare enthält, könnten Sie eine der folgenden Optionen verwenden:

    • Kommentare in einen iframe einschließen
    • Kommentare dynamisch mit AJAX abrufen
    • Einige Kommentare auf eine angrenzende Seite verschieben

    Falls der Fehler durch keinen dieser Vorschläge behoben wird, teilen Sie uns dies bitte mit.

    Artikel zu kurz

    Erläuterung

    Der von uns aus der HTML-Seite extrahierte Artikeltext enthält zu wenige Wörter für einen Nachrichtenartikel. Dies gilt für die meisten Seiten, die Kurznachrichten oder Multimedia-Inhalte anstatt vollständiger Nachrichtenartikel enthalten. Dieser Fehler wurde generiert, um einen möglicherweise fehlerhaften Text auszuschließen.

    Empfehlungen

    • Gliedern Sie Ihre Artikel in Textabschnitte, die jeweils einige Sätze enthalten. Wenn der Artikelinhalt zu wenige Wörter für einen Nachrichtenartikel enthält, können wir ihn nicht aufnehmen.
    • Ihre Artikel müssen mehr als 80 Wörter beinhalten.

    Falls der Fehler durch keinen dieser Vorschläge behoben wird, teilen Sie uns dies bitte mit.

    Datum nicht gefunden

    Erläuterung

    Das Veröffentlichungsdatum des Artikels konnte nicht ermittelt werden.

    Empfehlungen

    Beachten Sie die folgenden Empfehlungen zur Formatierung des Datums:

    • Geben Sie zwischen dem Titel und dem Text des Artikels in einer separaten HTML-Zeile das genaue Datum und die Uhrzeit an. Das Datum sollte angeben, wann der Artikel zum ersten Mal veröffentlicht wurde.
    • Entfernen Sie alle anderen Datumsangaben aus dem HTML-Code der Artikelseite, sodass der Crawler sie nicht versehentlich als Veröffentlichungsdatum ansieht.
    • Wenn Sie ein Meta-Tag für das Datum verwenden möchten, so setzen Sie sich bitte vorher mit uns in Verbindung. Meta-Tags für das Datum müssen folgendes Format aufweisen: <meta name="DC.date.issued" content="JJJJ-MM-TT">. Dabei steht das Datum im W3C-Format und wird entweder als vollständiges Datum (JJJJ-MM-TT) oder als vollständiges Datum mit Stunden, Minuten und Sekunden und angehängter Zeitzone angegeben (JJJJ-MM-TTThh:mm:ssZZZ).
    • Erstellen Sie eine Google News-Sitemap. Das Tag <publication_date> gewährleistet, dass für Ihre Artikel das richtige Datum ausgelesen wird.

    Datum zu alt

    Erläuterung

    Das Datum, das wir für diesen Artikel über ein <publication_date>-Tag in der Sitemap oder über ein Datum in der HTML-Seite ermittelt haben, ist zu alt.

    Empfehlungen

    • Achten Sie darauf, dass Ihr Artikel nicht mehr als zwei Tage alt ist. Zurzeit erfassen wir nur Artikel, die höchstens zwei Tage alt sind.
    • Beachten Sie die obigen Empfehlungen zur Formatierung des Datums.

    Leerer Artikel

    Erläuterung

    Der von uns aus der HTML-Seite extrahierte Artikeltext ist leer.

    Empfehlungen

    • Vergewissern Sie sich, dass der vollständige Text Ihrer Artikel im Quellcode Ihrer Artikelseiten enthalten und nicht etwa in einer JavaScript-Datei oder einen iFrame eingebettet ist.
    • Verwenden Sie im Quellcode Ihrer Artikel keinen Stil wie "display:none" oder "visibility:hidden".
    • Die Links zu Ihren Artikeln müssen direkt zu Ihren Artikelseiten führen und nicht auf eine Zwischenseite mit JavaScript-Umleitung.

    Extraktion fehlgeschlagen

    Erläuterung

    Der Artikel konnte nicht aus der Seite extrahiert werden. Extraktionen schlagen fehl, wenn wir keinen gültigen Titel, keinen Textkörper und keinen Zeitstempel für den Artikel finden können. Wir listen URLs mit diesem Fehler auf, um Sie darüber zu informieren, warum manche Artikel nicht in Google News erscheinen.

    Empfehlungen

    • Achten Sie darauf, dass Titel, Textkörper und Zeitstempel leicht gecrawlt werden können. Dazu sollten diese Elemente als Text und nicht zum Beispiel als Bild verfügbar sein. Derzeit dient dieser Fehler lediglich zur Information. Wir arbeiten intensiv an der Verbesserung unserer Extraktionsmethoden, damit dieser Fehler seltener auftritt.
    • Reichen Sie eine Google News-Sitemap ein.

    Ungültiges Meta-Tag für Datum

    Erläuterung

    Die HTML-Seite enthält ein Meta-Tag für das Datum, das nicht geparst werden konnte.

    Empfehlungen

    Datums-Meta-Tags sollten in folgender Form vorliegen: <meta name="DC.date.issued" content="JJJJ-MM-TT">. Dabei ist das Datum im W3C-Format (http://www.w3.org/TR/NOTE-datetime) angegeben und wird entweder als "vollständiges Datum" (JJJJ-MM-TT) oder als "vollständiges Datum mit Stunden, Minuten und Sekunden" (JJJJ-MM-TTThh:mm:ss) mit optionalen Bruchteilen und Zeitzonenanhängen angezeigt. Das Datum sollte angeben, wann der Artikel zum ersten Mal veröffentlicht wurde.

    Keine Links gefunden

    Erläuterung

    Googlebot-News hat auf der Seite keine Links zu gültigen Nachrichtenartikeln gefunden. Dieser Fehler tritt nur bei Seiten mit Nachrichtenbereichen auf.

    Empfehlungen

    • Achten Sie darauf, dass Ihre Artikel-URLs eine mindestens dreistellige Zahl enthalten, so wie in diesem Artikel beschrieben. Eine alternative Möglichkeit besteht darin, die Artikel mithilfe von Google News-Sitemaps einzureichen.
    • Achten Sie darauf, dass sich Ihre Artikel in der Domain der Website befinden, die bei Google News registriert ist.
    • Überprüfen Sie die Seite, die den Fehler verursacht hat, und vergewissern Sie sich, dass sie Links zu Nachrichtenartikeln enthält, die gecrawlt werden können. Am besten kann Googlebot-News HTML-Links crawlen. Bildlinks oder in JavaScript eingebettete Links können nicht gecrawlt werden. Wie Sie sicherstellen, dass Ihre Links gecrawlt werden können, erfahren Sie in den Richtlinien für Webmaster und den Tipps zum Erstellen einer Google-freundlichen Website.

    Keine Sätze gefunden

    Erläuterung

    Der von uns aus der HTML-Seite extrahierte Artikeltext enthält anscheinend keine zusammenhängende Folge von Wörtern mit Satzzeichen. Dieser Fehler wurde generiert, um einen möglicherweise fehlerhaften Textabschnitt auszuschließen.

    Empfehlungen

    • Wenn der Artikel keine zusammenhängende Folge von Wörtern mit Satzzeichen enthält, kann er nicht in Google News aufgenommen werden. Vergewissern Sie sich, dass der Text Ihrer Artikel aus Sätzen besteht und Sie in den Absätzen nicht zu häufig die Tags <br> und <p> verwenden.
    • Der vollständige Text aller Artikel muss im Quellcode Ihrer Artikelseiten enthalten sein. Die Einbettung in eine JavaScript-Datei reicht beispielsweise nicht aus.
    • Die Links zu Ihren Artikeln müssen direkt zu Ihren Artikelseiten und dürfen nicht auf eine Zwischenseite mit JavaScript-Umleitung führen.

    noindex-Tag gefunden

    Erläuterung

    Die HTML-Seite des Artikels enthält das Meta-Tag "noindex", das Google daran hindert, die Seite zu indexieren.

    Empfehlungen

    Entfernen Sie das noindex-Meta-Tag von Ihren Artikelseiten.

    Off-Site-Weiterleitung

    Erläuterung

    Der Abschnitt oder die Artikelseite verweist auf eine URL in einer anderen Domain.

    Empfehlungen

    • Alle Bereichsseiten und Artikel müssen sich innerhalb der Domain der Website befinden, die in Google News aufgenommen wurde.
    • Falls Sie keine Off-Site-Weiterleitungen verwenden, dann vergewissern Sie sich, dass Ihre Website nicht von Dritten geändert wurde. Weitere Informationen zu gehackten Websites

    Seite zu groß

    Erläuterung

    Die Länge des Abschnitts oder der Artikelseite überschreitet den zulässigen Maximalwert.

    Empfehlungen

    Die HTML-Quellseite darf maximal 256 KB umfassen.

    Titel nicht zulässig

    Erläuterung

    Der von uns aus der HTML-Seite extrahierte Titel deutet nicht auf einen Nachrichtenartikel hin.

    Empfehlungen

    Dieses Problem lässt sich häufig lösen, indem Sie das <title>-Tag der HTML-Seite auf den Titel des Artikels ändern und den Titel an einer auffälligen Stelle der HTML-Seite wiederholen, etwa in einem <h1>-Tag. Weitere Informationen zu Titeln

    Titel nicht gefunden

    Erläuterung

    Wir konnten keinen Artikeltitel aus der HTML-Seite extrahieren.

    Empfehlungen

    • Beachten Sie unsere Empfehlungen zur Formatierung von Titeln.
    • Um sicherzustellen, dass Ihre Artikel auf Mobilgeräten richtig angezeigt werden, sollten Sie auf eine führende Zahl (entspricht manchmal einem Zugriffsschlüssel) am Anfang des Titelankertexts verzichten.

    Dekomprimierung fehlgeschlagen

    Erläuterung

    Der Googlebot-News hat festgestellt, dass die Seite komprimiert wurde, konnte sie jedoch nicht dekomprimieren. Ursache hierfür kann ein fehlerhafter Netzwerkzustand oder eine fehlerhafte Programmierung oder Konfiguration des Webservers sein.

    Empfehlungen

    Überprüfen Sie Ihren Netzwerk- oder Webserver.

    Nicht unterstützter Inhaltstyp

    Erläuterung

    Die Seite weist einen HTTP-Inhaltstyp auf, der von Google News nicht unterstützt wird.

    Empfehlungen

    Die Artikel müssen die Inhaltstypen "text/html", "text/plain" oder "application/xhtml+xml" aufweisen.

    Google News-Sitemaps sollten möglichst überschaubar und klar strukturiert sein. Bei Veröffentlichung neuer Artikel aktualisieren Sie bitte Ihre bestehenden Sitemaps und erstellen Sie keine neuen Sitemaps. Es empfiehlt sich nicht, häufig (z. B. für jeden Kalendertag) eine neue Sitemap zu erstellen.