Crawling-Fehler bei Google News

Verlage und Webpublisher können Fehlerberichte speziell für Google News erhalten, wenn ihre Website bei Google News registriert ist, sie über ein Webmaster-Tools-Konto verfügen und ihre Website zu ihrem Konto hinzugefügt haben. Setzen Sie sich mit uns in Verbindung, um die Aufnahme in Google News zu beantragen. Führen Sie anschließend die folgenden Schritte durch:

  • Klicken Sie auf der Startseite auf die URL der Website.
  • Klicken Sie auf dem Dashboard auf Crawling > Crawling-Fehler.
  • Klicken Sie auf den Tab News, um die Crawling-Fehler für die News-Inhalte anzusehen.
  • Crawling-Fehler werden in Kategorien eingeteilt, etwa "Artikelextraktion" oder "Fehler im Titel". Wenn Sie auf eine dieser Kategorien klicken, erscheint eine Liste betroffener URLs zusammen mit den jeweiligen Crawling-Fehlern, die sie verursachen.
  • Zu den News-spezifischen Fehlern zählen die Folgenden:

    Artikel ist unverhältnismäßig kurz

    Erklärung

    Der von uns aus der HTML-Seite extrahierte Artikeltext ist im Vergleich zu anderen linkfreien Texten auf der Seite zu kurz. Dies gilt für die meisten Seiten, die Kurznachrichten oder Multimedia-Inhalte anstelle von vollständigen Nachrichtenartikeln enthalten. Wir haben diesen Fehler generiert, um einen möglicherweise fehlerhaften Text auszuschließen.

    Empfehlungen

    Dieses Problem tritt oft aus den folgenden Gründen auf:

    • Zu viele Snippets für verwandte Artikel – Bitte ziehen Sie in Betracht, diese Snippets klickbar zu machen, damit unser Extrahierer besser funktioniert.
    • Funktionen wie "Diesen Artikel an Freunde senden" mit langen Beschreibungen – Zur Vermeidung des Fehlers können Sie die Stile "display:none" oder "visibility:hidden" einstellen, damit der Text unsichtbar wird, oder den HTML-Code von JavaScript dynamisch schreiben lassen.
    • Nutzerkommentare – Zur Vermeidung des Fehlers können Sie die Kommentare in einen Iframe einbetten, sie dynamisch mit AJAX abrufen oder sie auf eine angrenzende Seite verlagern.

    Falls der Fehler durch keinen dieser Vorschläge behoben werden kann, teilen Sie uns dies bitte mit.

    Artikel fragmentiert

    Erklärung

    Der von uns aus der HTML-Seite extrahierte Artikeltext besteht aus einzelnen Sätzen, die nicht in Abschnitte gegliedert sind. Wir haben diesen Fehler generiert, um einen möglicherweise fehlerhaften Text auszuschließen.

    Empfehlungen

    • Achten Sie darauf, dass jeder Absatz mehr als einen Satz enthält.
    • Achten Sie auf die korrekte Interpunktion Ihrer Sätze.
    • Verwenden Sie innerhalb der Absätze nicht allzu häufig die Tags <br> und <p> und vermeiden Sie es, den Artikeltext in viele kleine Teile aufzuteilen.
    • Sie haben auch die Möglichkeit, einen Teil des Textes, der nicht zum Artikel gehört, von der Artikelseite zu entfernen.

    Falls der Fehler durch keinen dieser Vorschläge behoben werden kann, teilen Sie uns dies bitte mit.

    Artikel zu lang

    Erklärung

    Der von uns aus der HTML-Seite extrahierte Artikeltext ist zu lang für einen Nachrichtenartikel. Wir haben diesen Fehler generiert, um einen möglicherweise fehlerhaften Text auszuschließen. Häufig handelt es sich hierbei um Nachrichtenartikel mit Nutzerkommentaren unter dem Artikel oder um HTML-Layouts, die weitere Materialien außer dem Artikel selbst enthalten.

    Empfehlungen

    Sie haben auch die Möglichkeit, einen Teil des Textes, der nicht zum Artikel gehört, von der Artikelseite zu entfernen. Wenn die Artikelseite Nutzerkommentare enthält, können Sie Folgendes tun:

    • Einen Iframe einbetten
    • Kommentare dynamisch mit AJAX abrufen
    • Einige Kommentare auf eine angrenzende Seite verschieben

    Falls der Fehler durch keinen dieser Vorschläge behoben werden kann, teilen Sie uns dies bitte mit.

    Artikel zu kurz

    Erklärung

    Der von uns aus der HTML-Seite extrahierte Artikeltext enthält zu wenig Wörter für einen Nachrichtenartikel. Dies gilt für die meisten Seiten, die Kurznachrichten oder Multimedia-Inhalte anstelle von vollständigen Nachrichtenartikeln enthalten. Wir haben diesen Fehler generiert, um einen möglicherweise fehlerhaften Text auszuschließen.

    Empfehlungen

    • Gliedern Sie Ihre Artikel in Absätze mit wenigen Sätzen. Wenn der Artikel zu wenige Wörter für einen Nachrichtenartikel enthält, können wir ihn nicht aufnehmen.
    • Achten Sie darauf, dass Ihre Artikel mehr als 80 Wörter enthalten.

    Falls der Fehler durch keinen dieser Vorschläge behoben werden kann, teilen Sie uns dies bitte mit.

    Datum nicht gefunden

    Erklärung

    Das Veröffentlichungsdatum des Artikels konnte nicht ermittelt werden.

    Empfehlungen

    Folgen Sie diesen Empfehlungen für das Datumsformat:

    • Geben Sie zwischen dem Titel und dem Text des Artikels das genaue Datum und die Uhrzeit in einer separaten HTML-Zeile an. Das Datum sollte das erste Veröffentlichungsdatum des Artikels sein.
    • Entfernen Sie alle anderen Datumsangaben aus dem HTML-Code der Artikelseite, sodass der Crawler diese nicht versehentlich als Veröffentlichungsdatum ansieht.
    • Wenn Sie ein Meta-Tag für das Datum verwenden möchten, setzen Sie sich bitte vorher mit uns in Verbindung. Meta-Tags für das Datum sollten in folgender Form vorliegen: <meta name="DC.date.issued" content="JJJJ-MM-TT">. Dabei ist das Datum im W3C-Format und wird entweder als vollständiges Datum (JJJJ-MM-TT) oder als vollständiges Datum mit Stunden, Minuten und Sekunden und angehängter Zeitzone angegeben (JJJJ-MM-TTTss:mm:ssZZZ).
    • Erstellen Sie eine Google News-Sitemap. Das Tag <publication_date> gewährleistet, dass das richtige Datum für Ihre Artikel ausgelesen wird.

    Datum liegt zu weit zurück

    Erklärung

    Das Datum, das wir für diesen Artikel über ein <publication_date>-Tag in der XML-Sitemap oder über ein Datum in der HTML-Seite ermittelt haben, liegt zu weit zurück.

    Empfehlungen

    • Beachten Sie, dass der Artikel nicht älter als zwei Tage sein darf. Zurzeit erfassen wir nur Artikel, die höchstens zwei Tage alt sind.
    • Folgen Sie den genannten Empfehlungen für das Datumsformat.

    Leerer Artikel

    Erklärung

    Der von uns aus der HTML-Seite extrahierte Artikeltext ist leer.

    Empfehlungen

    • Vergewissern Sie sich, dass der vollständige Text Ihrer Artikel im Quellcode der Artikelseite enthalten und nicht etwa in einer JavaScript-Datei oder einen Iframe eingebettet ist.
    • Stellen Sie sicher, dass Sie keinen Stil im Quellcode Ihrer Artikel verwenden, wie etwa "display:none" oder "visibility:hidden".
    • Achten Sie darauf, dass die Links zu Ihren Artikeln direkt zur Artikelseite führen und nicht zu einer Zwischenseite mithilfe einer JavaScript-Weiterleitung.

    Fehler bei der Extraktion

    Erklärung

    Wir konnten den Artikel nicht aus der Seite extrahieren. Fehler bei Extraktionen treten auf, wenn wir keinen gültigen Titel, keinen Textkorpus und keinen Zeitstempel für den Artikel finden können. Wir geben URLs mit diesem Fehler aus, um Sie darüber zu informieren, warum manche Artikel nicht auf Google News erscheinen.

    Empfehlungen

    • Stellen Sie sicher, dass Titel, Textkorpus und Zeitstempel leicht gecrawlt werden können. Dazu sollten sie beispielsweise als Text und nicht als Bild vorliegen. Derzeit dient dieser Fehler jedoch vor allem zu informativen Zwecken. Wir arbeiten intensiv an der Verbesserung unserer Extraktionsmethoden, damit dieser Fehler seltener auftritt.
    • Senden Sie eine Google News-Sitemap.

    Ungültiger Datums-Meta-Tag

    Erklärung

    Die HTML-Seite enthält ein Datums-Meta-Tag, das wir nicht parsen konnten.

    Empfehlungen

    Meta-Tags für das Datum sollten in folgender Form vorliegen: <meta name="DC.date.issued" content="JJJJ-MM-TT">. Dabei ist das Datum im W3C-Format und wird entweder als vollständiges Datum (JJJJ-MM-TT) oder als vollständiges Datum mit Stunden, Minuten und Sekunden (JJJJ-MM-TTTss:mm:ss) angegeben, optional mit Nachkommastelle und angehängter Zeitzone. Das Datum sollte angeben, wann der Artikel zum ersten Mal veröffentlicht wurde.

    Keine Links gefunden

    Erklärung

    Googlebot-News hat auf der Seite keine Links zu gültigen Nachrichtenartikeln gefunden. Dieser Fehler tritt nur bei Seiten mit Nachrichtenbereichen auf.

    Empfehlungen

    • Achten Sie darauf, dass Ihre Artikel-URLs eine mindestens dreistellige Zahl enthalten, so wie in diesem Artikel beschrieben. Anderenfalls sollten Sie in Erwägung ziehen, Ihre Artikel mithilfe von Google News-Sitemaps einzureichen.
    • Achten Sie darauf, dass sich Ihre Artikel in der Domain der Website befinden, die bei Google News registriert ist.
    • Überprüfen Sie die Seite, die den Fehler verursacht hat, und vergewissern Sie sich, dass sie Links zu Nachrichtenartikeln enthält, die gecrawlt werden können. Am besten kann Googlebot-News HTML-Links crawlen. Bildlinks oder in JavaScript eingebettete Links können nicht gecrawlt werden. Wie Sie sicherstellen, dass Ihre Links gecrawlt werden können, erfahren Sie in den Richtlinien für Webmaster und den Tipps zum Erstellen einer Google-freundlichen Website.

    Keine Sätze gefunden

    Erklärung

    Der von uns aus der HTML-Seite extrahierte Artikeltext enthält keine Sätze mit Satzzeichen oder keine zusammenhängenden Wörter. Wir haben diesen Fehler generiert, um einen möglicherweise fehlerhaften Textabschnitt auszuschließen.

    Empfehlungen

    • Wenn der Artikel keine mit Satzzeichen versehenen Sequenzen zusammenhängender Wörter enthält, dann können wir ihn nicht in Google News aufnehmen. Vergewissern Sie sich, dass der Text Ihrer Artikel aus Sätzen besteht und Sie innerhalb Ihrer Absätze nicht zu häufig die Tags <br> und <p> verwenden.
    • Vergewissern Sie sich, dass der vollständige Text Ihrer Artikel im Quellcode der Artikelseite enthalten und beispielsweise nicht in einer JavaScript-Datei eingebettet ist.
    • Achten Sie darauf, dass die Links zu Ihren Artikeln direkt zur Artikelseite führen und nicht zu einer Zwischenseite mithilfe einer JavaScript-Weiterleitung.

    "Noindex"-Tag gefunden

    Erklärung

    Die HTML-Seite des Artikels enthält das Meta-Tag "noindex", das Google daran hindert, die Seite zu indexieren.

    Empfehlungen

    Entfernen Sie das "noindex"-Meta-Tag von Ihren Artikelseiten.

    Off-Site-Weiterleitung

    Erklärung

    Der Bereich oder die Artikelseite leitet zu einer URL auf einer anderen Domain weiter.

    Empfehlungen

    • Alle Bereichsseiten und Artikel müssen sich innerhalb der Domain der Website befinden, die bei Google News registriert ist.
    • Falls Sie keine Off-Site-Weiterleitungen verwenden, vergewissern Sie sich, dass Ihre Website nicht von Dritten geändert wurde. Weitere Informationen zu gehackten Websites

    Seite zu groß

    Erklärung

    Die Länge des Bereichs oder der Artikelseite überschreitet den zulässigen Maximalwert.

    Empfehlungen

    Die HTML-Quellseite kann bis zu 256 KB groß sein.

    Titel nicht zulässig

    Erklärung

    Der von uns aus der HTML-Seite extrahierte Titel lässt nicht auf einen Nachrichtenartikel schließen.

    Empfehlungen

    Dieses Problem lässt sich häufig lösen, indem Sie das <title>-Tag auf der HTML-Seite auf den Titel des Artikels ändern und den Titel an einer auffälligen Stelle der HTML-Seite wiederholen, etwa in einem <h1>-Tag. Weitere Informationen zu Titeln

    Titel nicht gefunden

    Erklärung

    Wir konnten keinen Titel aus der HTML-Seite extrahieren.

    Empfehlungen

    • Befolgen Sie unsere Empfehlungen zur Formatierung von Titeln.
    • Um sicherzustellen, dass Ihre Artikel richtig auf Mobilgeräten erscheinen, sollten Sie auf eine Zahl, die manchmal einem Zugriffsschlüssel entspricht, am Anfang des Titelankertexts verzichten.

    Fehler bei der Dekomprimierung

    Erklärung

    Googlebot-News hat festgestellt, dass die Seite komprimiert wurde, konnte sie jedoch nicht dekomprimieren. Dies kann auf einen schlechten Zustand des Netzwerks oder eine fehlerhafte Programmierung oder Konfiguration des Webservers zurückzuführen sein.

    Empfehlungen

    Überprüfen Sie Ihr Netzwerk bzw. Ihren Webserver.

    Nicht unterstützter Inhaltstyp

    Erklärung

    Die Seite weist einen HTTP-Inhaltstyp auf, der von Google News nicht unterstützt wird.

    Empfehlungen

    Die Artikel müssen die Inhaltstypen "text/html", "text/plain" oder "application/xhtml+xml" enthalten.

    Google News-XML-Sitemaps werden idealerweise in kleine, feste Sätze gegliedert. Bitte aktualisieren Sie Ihre bestehenden Sitemaps und erstellen Sie keine neuen, wenn Sie Nachrichtenartikel veröffentlichen. Die häufige Erstellung neuer Sitemaps, etwa für jeden Kalendertag, ist nicht empfehlenswert.

Wie hilfreich ist dieser Artikel:

Das Feedback wurde aufgezeichnet. Vielen Dank!
  • Überhaupt nicht hilfreich
  • Nicht sehr hilfreich
  • Einigermaßen hilfreich
  • Hilfreich
  • Sehr hilfreich