Crawling-Fehler in Google News

Hinweis: Beachten Sie, dass unser Nachrichtenindex durch einen Computer-Algorithmus erstellt wird. Obwohl wir versuchen, möglichst viele Ihrer Inhalte aufzunehmen, können wir nicht die Aufnahme jedes einzelnen Artikels garantieren. Vielen Dank für Ihr Verständnis.

Verlage und Webpublisher, die Nachrichten veröffentlichen, können sich speziell für Google News Fehlerberichte anzeigen lassen, wenn ihre Website in Google News aufgenommen wurde, sie ein Search Console-Konto erstellt und die Website dem Konto hinzugefügt haben. Führen Sie dann folgende Schritte in der Search Console aus:

  • Klicken Sie auf der Startseite auf die URL der Website.
  • Klicken Sie auf dem Dashboard auf Crawling > Crawling-Fehler.
  • Klicken Sie auf den Tab News, um die Crawling-Fehler zu Ihren Nachrichteninhalten anzuzeigen.
  • Crawling-Fehler sind in Kategorien eingeteilt, etwa "Artikelextraktion" oder "Fehler im Titel". Wenn Sie auf eine dieser Kategorien klicken, erscheint eine Liste betroffener URLs zusammen mit den Crawling-Fehlern, die sie verursachen.

Crawling-Fehler in Google News sind beispielsweise die folgenden:

Artikel ist unverhältnismäßig kurz

Erläuterung

Der von uns aus der HTML-Seite extrahierte Artikeltext ist im Vergleich zu anderen linkfreien Texten auf der Seite zu kurz. Dies gilt für die meisten Seiten, die Kurznachrichten oder Multimedia-Inhalte anstatt vollständiger Nachrichtenartikel enthalten. Dieser Fehler wurde generiert, um die Aufnahme eines möglicherweise fehlerhaften Textes zu vermeiden.

Empfehlungen

Dieses Problem tritt oft aus folgenden Gründen auf:

  • Zu viele Snippets für verwandte Artikel – Unser Extrahierer würde besser funktionieren, wenn Sie diese Snippets klickbar machen.
  • Funktionen wie "Diesen Artikel an Freunde senden" mit langen Beschreibungen – Sie können als Stil "display:none" oder "visibility:hidden" festlegen, um den Text unsichtbar zu machen, oder Sie können die HTML-Codeabschnitte durch JavaScript dynamisch schreiben lassen.
  • Nutzerkommentare – Zur Vermeidung dieses Fehlers können Sie die Kommentare in einen iFrame einbetten, sie dynamisch mit AJAX abrufen oder sie auf eine angrenzende Seite verschieben.
Artikel fragmentiert

Erläuterung

Der von uns aus der HTML-Seite extrahierte Artikeltext besteht aus einzelnen Sätzen, die nicht in Absätze gegliedert sind. Dieser Fehler wurde generiert, um die Aufnahme eines möglicherweise fehlerhaften Textes zu vermeiden.

Empfehlungen

  • Achten Sie darauf, dass jeder Absatz mehr als einen Satz enthält.
  • Achten Sie auf korrekte Zeichensetzung.
  • Verwenden Sie innerhalb der Absätze nicht häufig die Tags <br> und <p> und vermeiden Sie es allgemein, den Artikeltext in viele kleine Teile zu zersplittern.
  • Um diesen Fehler zu vermeiden, können Sie einen Teil des Textes, der nicht zum Artikel gehört, von der Artikelseite entfernen.
Artikel zu lang

Erläuterung

Der von uns aus der HTML-Seite extrahierte Artikeltext erscheint für einen Nachrichtenartikel zu lang. Dieser Fehler wurde generiert, um die Aufnahme eines möglicherweise fehlerhaften Textes zu vermeiden. Häufig handelt es sich hierbei um Nachrichtenartikel mit Nutzerkommentaren unter dem Artikel oder um HTML-Layouts, die weiteres Material außer dem Artikel selbst enthalten.

Empfehlungen

Um diesen Fehler zu vermeiden, können Sie einen Teil des Textes, der nicht zum Artikel gehört, von der Artikelseite entfernen. Wenn die Artikelseite Nutzerkommentare enthält, könnten Sie eine der folgenden Optionen verwenden:

  • Kommentare in einen iframe einschließen
  • Kommentare dynamisch mit AJAX abrufen
  • Einige Kommentare auf eine angrenzende Seite verschieben
Artikel zu kurz

Erläuterung

Der von uns aus der HTML-Seite extrahierte Artikeltext enthält zu wenige Wörter für einen Nachrichtenartikel. Dies gilt für die meisten Seiten, die Kurznachrichten oder Multimedia-Inhalte anstatt vollständiger Nachrichtenartikel enthalten. Dieser Fehler wurde generiert, um die Aufnahme eines möglicherweise fehlerhaften Textes zu vermeiden.

Empfehlungen

  • Gliedern Sie Ihre Artikel in Textabsätze, die jeweils einige Sätze enthalten. Wenn der Artikelinhalt zu wenige Wörter für einen Nachrichtenartikel enthält, können wir ihn nicht aufnehmen.
  • Ihre Artikel müssen mehr als 80 Wörter enthalten.
Datum nicht gefunden

Erläuterung

Das Veröffentlichungsdatum des Artikels konnte nicht ermittelt werden.

Empfehlungen

Beachten Sie die folgenden Empfehlungen zur Formatierung des Datums:

  • Geben Sie zwischen dem Titel und dem Text des Artikels in einer separaten HTML-Zeile das genaue Datum und die Uhrzeit an. Das Datum sollte angeben, wann der Artikel zum ersten Mal veröffentlicht wurde.
  • Entfernen Sie alle anderen Datumsangaben aus dem HTML-Code der Artikelseite, sodass der Crawler sie nicht versehentlich als Veröffentlichungsdatum ansieht.
  • Wenn Sie ein Meta-Tag für das Datum verwenden möchten, so setzen Sie sich vorher mit uns in Verbindung. Meta-Tags für das Datum müssen folgendes Format aufweisen: <meta name="DC.date.issued" content="JJJJ-MM-TT">. Dabei steht das Datum im W3C-Format und wird entweder als vollständiges Datum (JJJJ-MM-TT) oder als vollständiges Datum mit Stunden, Minuten und Sekunden und angehängter Zeitzone angegeben (JJJJ-MM-TTThh:mm:ssZZZ).
  • Erstellen Sie eine Google News-Sitemap. Das Tag <publication_date> sorgt dafür, dass wir das korrekte Datum für Ihre Artikel auswählen können.
Datum zu alt

Erläuterung

Das Datum, das wir für diesen Artikel über ein <publication_date>-Tag in der Sitemap oder über ein Datum in der HTML-Seite ermittelt haben, ist zu alt.

Empfehlungen

  • Achten Sie darauf, dass Ihr Artikel höchstens zwei Tage alt ist. Zurzeit erfassen wir nur Artikel, die maximal zwei Tage alt sind.
  • Beachten Sie die obigen Empfehlungen zur Formatierung des Datums.
Leerer Artikel

Erläuterung

Der von uns aus der HTML-Seite extrahierte Artikeltext ist leer.

Empfehlungen

  • Vergewissern Sie sich, dass der vollständige Text Ihrer Artikel im Quellcode Ihrer Artikelseiten enthalten und nicht etwa in einer JavaScript-Datei oder einen iFrame eingebettet ist.
  • Verwenden Sie im Quellcode Ihrer Artikel keinen Stil wie "display:none" oder "visibility:hidden".
  • Die Links zu Ihren Artikeln müssen direkt zu Ihren Artikelseiten führen und nicht auf eine Zwischenseite mit JavaScript-Weiterleitung.
Extraktion fehlgeschlagen

Erläuterung

Der Artikel konnte nicht aus der Seite extrahiert werden. Extraktionen können nicht durchgeführt werden, wenn wir keinen gültigen Titel, Text und Zeitstempel für den Artikel finden können. Wir listen URLs mit diesem Fehler auf, um Sie darüber zu informieren, warum manche Artikel nicht auf Google News erscheinen.

Empfehlungen

  • Achten Sie darauf, dass Titel, Textkörper und Zeitstempel leicht gecrawlt werden können. Dazu sollten diese Elemente als Text und nicht zum Beispiel als Bild verfügbar sein. Derzeit dient dieser Fehler lediglich zur Information. Wir arbeiten intensiv an der Verbesserung unserer Extraktionsmethoden, damit dieser Fehler seltener auftritt.
  • Reichen Sie eine Google News-Sitemap ein.
Ungültiges Meta-Tag für Datum

Erläuterung

Die HTML-Seite enthält ein Datums-Meta-Tag, das wir nicht parsen können.

Empfehlungen

Meta-Tags für das Datum müssen folgendes Format aufweisen: <meta name="DC.date.issued" content="JJJJ-MM-TT">. Dabei steht das Datum im W3C-Format und wird entweder als vollständiges Datum (JJJJ-MM-TT) oder als vollständiges Datum mit Stunden, Minuten und Sekunden und angehängter Zeitzone angegeben (JJJJ-MM-TTThh:mm:ssZZZ). Das Datum sollte angeben, wann der Artikel zum ersten Mal veröffentlicht wurde.

Keine Links gefunden

Erläuterung

Googlebot-News hat auf der Seite keine Links zu gültigen Nachrichtenartikeln gefunden. Dieser Fehler tritt nur bei Seiten mit Nachrichtenbereichen auf.

Empfehlungen

  • Achten Sie darauf, dass Ihre Artikel-URLs eine mindestens dreistellige Zahl enthalten, so wie in diesem Artikel beschrieben. Eine alternative Möglichkeit besteht darin, die Artikel mithilfe einer Google News-Sitemaps einzureichen.
  • Achten Sie darauf, dass sich Ihre Artikel in der Domain der Website befinden, die bei Google News registriert ist.
  • Überprüfen Sie die Seite, die den Fehler verursacht hat, und vergewissern Sie sich, dass sie Links zu Nachrichtenartikeln enthält, die gecrawlt werden können. Am besten kann Googlebot-News HTML-Links crawlen. Bildlinks oder in JavaScript eingebettete Links können nicht gecrawlt werden. Wie Sie sicherstellen, dass Ihre Links gecrawlt werden können, erfahren Sie in den Richtlinien für Webmaster und den Tipps zum Erstellen einer Google-freundlichen Website.
Keine Sätze gefunden

Erläuterung

Der von uns aus der HTML-Seite extrahierte Artikeltext enthält anscheinend keine zusammenhängende Folge von Wörtern mit Satzzeichen. Dieser Fehler wurde generiert, um die Aufnahme eines möglicherweise fehlerhaften Textabschnitts zu vermeiden.

Empfehlungen

  • Wenn der Artikel keine zusammenhängende Folge von Wörtern mit Satzzeichen enthält, kann er nicht in Google News aufgenommen werden. Vergewissern Sie sich, dass der Text Ihrer Artikel aus Sätzen besteht und Sie innerhalb Ihrer Absätze nicht häufig die Tags <br> oder <p> verwenden.
  • Der vollständige Text aller Artikel muss im Quellcode Ihrer Artikelseiten enthalten sein. Die Einbettung in eine JavaScript-Datei reicht beispielsweise nicht aus.
  • Die Links zu Ihren Artikeln müssen direkt zu Ihren Artikelseiten und dürfen nicht auf eine Zwischenseite mit JavaScript-Weiterleitung führen.
noindex-Tag gefunden

Erläuterung

Die HTML-Seite des Artikels enthält das <meta>-Tag "noindex", das Google daran hindert, die Seite zu indexieren.

Empfehlungen

Entfernen Sie das <meta>-Tag "noindex" aus Ihren Artikelseiten.

Off-Site-Weiterleitung

Erläuterung

Die Bereichs- oder Artikelseite verweist auf eine URL in einer anderen Domain.

Empfehlungen

  • Alle Bereichsseiten und Artikel müssen sich innerhalb der Domain der Website befinden, die in Google News aufgenommen wurde.
  • Falls Sie keine Weiterleitungen zu anderen Websites verwenden, vergewissern Sie sich, dass Ihre Website nicht von Dritten geändert wurde. Weitere Informationen zu gehackten Websites
Seite zu groß

Erläuterung

Die Länge der Bereichs- oder Artikelseite überschreitet den zulässigen Maximalwert.

Empfehlungen

Die HTML-Quellseite darf maximal 256 KB umfassen.

Titel nicht zulässig

Erläuterung

Der von uns aus der HTML-Seite extrahierte Titel deutet nicht auf einen Nachrichtenartikel hin.

Empfehlungen

Dieses Problem lässt sich häufig lösen, indem Sie im <title>-Tag der HTML-Seite den Titel des Artikels angeben und den Titel an einer auffälligen Stelle der HTML-Seite wiederholen, etwa in einem <h1>-Tag. Weitere Informationen zu Titeln

Titel nicht gefunden

Erläuterung

Aus der HTML-Seite konnte kein Artikeltitel extrahiert werden.

Empfehlungen

  • Beachten Sie unsere Empfehlungen zur Formatierung von Titeln.
  • Um sicherzustellen, dass Ihre Artikel auf Mobilgeräten richtig angezeigt werden, sollten Sie auf eine vorangestellte Zahl (entspricht manchmal einem Zugriffsschlüssel) am Anfang des Titelankertexts verzichten.
Dekomprimierung fehlgeschlagen

Erläuterung

Der Googlebot-News hat festgestellt, dass die Seite komprimiert wurde, konnte sie jedoch nicht dekomprimieren. Ursache hierfür kann ein fehlerhafter Netzwerkzustand oder eine fehlerhafte Programmierung oder Konfiguration des Webservers sein.

Empfehlungen

Überprüfen Sie Ihren Netzwerk- oder Webserver.

Nicht unterstützter Inhaltstyp

Erläuterung

Die Seite weist einen HTTP-Inhaltstyp auf, der von Google News nicht unterstützt wird.

Empfehlungen

Die Artikel müssen die Inhaltstypen "text/html", "text/plain" oder "application/xhtml+xml" aufweisen.

War dieser Artikel hilfreich?