Crawling-Fehlerbericht für Websites

Im Bericht Crawling-Fehler für Websites finden Sie Details zu den Website-URLs, die Google nicht crawlen konnte oder für die ein HTTP-Fehlercode zurückgegeben wurde.

Crawling-Fehlerbericht öffnen

 

Suchen Sie den Crawling-Statusbericht für Apps?

 

Der Bericht hat zwei Hauptbereiche:

  • Websitefehler: In diesem Bereich sehen Sie die wichtigsten Probleme, die in den letzten 90 Tagen aufgetreten sind und aufgrund derer der Googlebot nicht auf die gesamte Website zugreifen konnte. Klicken Sie auf ein beliebiges Feld, um das entsprechende Diagramm aufzurufen.
     
  • URL-Fehler: In diesem Bereich werden die spezifischen Fehler aufgeführt, die Google beim Crawlen bestimmter Desktop- oder Smartphone-Seiten erfasst hat. Die einzelnen Hauptbereiche der URL-Fehlerberichte entsprechen den unterschiedlichen Crawling-Mechanismen, die Google für den Zugriff auf Ihre Seiten verwendet. Die aufgeführten Fehler gelten speziell für diese Seitenarten.

Websitefehler

Bei ordnungsgemäß funktionierenden Websites sollte der Bereich "Websitefehler" des Berichts "Crawling-Fehler" keine Fehler enthalten. Das gilt für die meisten Websites, die Google crawlt. Wenn Google eine nennenswerte Anzahl von Websitefehlern erkennt, erhalten Sie eine entsprechende Nachricht. Die Größe Ihrer Website spielt dabei keine Rolle.

Wenn Sie die Seite "Crawling-Fehler" aufrufen, sehen Sie im Bereich "Websitefehler" neben den drei Fehlerkategorien "DNS", "Serververbindung" und "Abruf von robots.txt" kurze Statuscodes. Handelt es dabei nicht um ein grünes Häkchen, klicken Sie auf das Kästchen, um ein Diagramm der Crawling-Details für die letzten 90 Tage aufzurufen.

Hohe Fehlerraten

Wird für Ihre Website in einer der drei Kategorien eine Fehlerrate von 100 % angezeigt, bedeutet das, dass Ihre Website entweder offline oder auf irgendeine Art fehlerhaft konfiguriert ist. Dabei können Sie nach folgenden verschiedenen Ursachen forschen:

  • Vergewissern Sie sich, dass bei einer Websitereorganisation die Berechtigungen für einen Bereich Ihrer Website nicht geändert wurden.
  • Überprüfen Sie nach einer Reorganisation Ihrer Website, ob alle externen Links noch funktionieren.
  • Überprüfen Sie alle neuen Skripts, um sicherzustellen, dass es nicht wiederholt zu Fehlfunktionen kommt.
  • Vergewissern Sie sich, dass alle Verzeichnisse vorhanden sind und nicht versehentlich verschoben oder gelöscht wurden.
Trifft keine der zuvor erwähnten Situationen auf Ihre Website zu, handelt es sich bei der Fehlerrate eventuell nur um eine vorübergehende Spitze. Sie kann auch auf externen Ursachen beruhen, etwa Links zu nicht vorhandenen Seiten. Unter Umständen liegt auch gar kein Problem vor. In jedem Fall informieren wir Sie über eine ungewöhnlich große Anzahl von Fehlern für Ihre Website, damit Sie diesen auf den Grund gehen können.

Geringe Fehlerraten

Wenn Ihre Website in einer der Kategorien eine Fehlerrate unter 100 % aufweist, weist das möglicherweise auf ein nur vorübergehend auftretendes Problem hin. Es kann jedoch auch bedeuten, dass Ihre Website überlastet oder fehlerhaft konfiguriert ist. Sie sollten diese Probleme genauer untersuchen oder sie in unserem Forum diskutieren. Eventuell kontaktieren wir Sie selbst bei einer sehr geringen Gesamtfehlerrate, da wir der Meinung sind, dass eine gut konfigurierte Website gar keine Fehler in diesen Kategorien aufweisen sollte.

Websitefehlertypen

Die folgenden Fehlertypen werden im Bereich Website des Berichts aufgeführt:

DNS-Fehler

Was sind DNS-Fehler?

DNS-Fehler weisen darauf hin, dass keine Kommunikation zwischen dem Googlebot und dem DNS-Server möglich ist – entweder ist der Server abgestürzt oder es besteht ein Problem mit dem DNS-Routing zu Ihrer Domain. Die meisten DNS-Warnungen oder -Fehler wirken sich nicht darauf aus, ob der Googlebot auf Ihre Website zugreifen kann. Sie können jedoch auf eine hohe Latenz hinweisen, die die Nutzererfahrung negativ beeinflusst.

DNS-Fehler beheben

  • Vergewissern Sie sich, dass Google Ihre Website crawlen kann.
    Verwenden Sie das Tool Abruf wie durch Google auf einer wichtigen Seite, z. B. auf Ihrer Startseite. Wird der Inhalt Ihrer Startseite ohne Probleme zurückgegeben, können Sie davon ausgehen, dass Google ordnungsgemäß auf Ihre Website zugreifen kann.
  • Bei anhaltenden oder immer wieder auftretenden DNS-Fehlern sollten Sie sich an Ihren DNS-Anbieter wenden.
    Oftmals sind der DNS-Anbieter und der Webhostanbieter identisch. 
  • Konfigurieren Sie Ihren Server so, dass bei nicht vorhandenen Hostnamen ein HTTP-Fehlercode zurückgegeben wird, z. B. 404 oder 500.
    Eine Website wie ihrebeispielurl.de kann mit einer Wildcard-DNS-Einrichtung konfiguriert werden, um auf Anforderungen von foo.ihrebeispielurl.de, beispielname.ihrebeispielurl.de und jeder anderen Subdomain zu reagieren. Diese Lösung bietet sich an, wenn auf einer Website mit von Nutzern erstellten Inhalten jedem Nutzerkonto eine eigene Domain zugewiesen wird, z. B. http://nutzername.ihrebeispielurl.de. In manchen Fällen kann diese Konfiguration jedoch dazu führen, dass Inhalte für verschiedene Hostnamen dupliziert werden. Außerdem wirkt sie sich unter Umständen auf das Crawling des Googlebots aus.

DNS-Fehlerliste

Fehlertyp Beschreibung
DNS-Zeitüberschreitung

Google konnte nicht auf Ihre Website zugreifen, weil Ihr DNS-Server Ihren Hostnamen (z. B. www.ihrebeispielurl.de) nicht erkannt hat.

Verwenden Sie das Tool Abruf wie durch Google, um herauszufinden, ob der Googlebot Ihre Website zurzeit crawlen kann. Wenn das Tool den Inhalt Ihrer Startseite problemlos zurückgibt, können Sie davon ausgehen, dass der Googlebot grundsätzlich in der Lage ist, ordnungsgemäß auf Ihre Website zuzugreifen

Wenden Sie sich an Ihren Registrator, um zu überprüfen, ob Ihre Website korrekt eingerichtet wurde und Ihr Server mit dem Internet verbunden ist.

DNS-Lookup

Google konnte nicht auf Ihre Website zugreifen, weil Ihr DNS-Server Ihren Hostnamen (z. B. www.ihrebeispielurl.de) nicht erkannt hat.

Verwenden Sie das Tool Abruf wie durch Google, um herauszufinden, ob der Googlebot Ihre Website zurzeit crawlen kann. Wenn das Tool den Inhalt Ihrer Startseite problemlos zurückgibt, können Sie davon ausgehen, dass der Googlebot grundsätzlich in der Lage ist, ordnungsgemäß auf Ihre Website zuzugreifen

Wenden Sie sich an Ihren Registrator, um zu überprüfen, ob Ihre Website korrekt eingerichtet wurde und Ihr Server mit dem Internet verbunden ist.

Serverfehler

Was ist ein Serverfehler?

Wenn diese Fehler für Ihre URLs zurückgegeben werden, konnte der Googlebot nicht auf die URLs zugreifen, es kam zu einer Zeitüberschreitung bei der Anfrage oder Ihre Website war nicht verfügbar. Daher musste der Googlebot die Anfrage abbrechen. Google kann nicht auf Ihre Website zugreifen, weil der Server zu langsam reagiert oder Ihre Website Google blockiert. Aus diesem Grund war Google gezwungen, die Anfrage abzubrechen.

Serververbindungsfehler beheben

  • Verkürzen Sie die Seitenaufbauzeiten bei Anfragen an dynamische Seiten.
    Einige Websites stellen denselben Inhalt für mehrere URLs bereit. Diese Vorgehensweise wird auch als "dynamisch" bezeichnet. Beispielsweise wird für www.ihrebeispielurl.de/schuhe.php?farbe=rot&groesse=38 derselbe Inhalt bereitgestellt wie für www.ihrebeispielurl.de/schuhe.php?groesse=38&farbe=rot.  Dynamische Seiten reagieren manchmal zu langsam, was zu Zeitüberschreitungen führt. Oder der Server meldet eine Überlastung und fordert den Googlebot auf, die Website langsamer zu crawlen. Im Allgemeinen empfehlen wir, Parameter sparsam zu verwenden und möglichst kurz zu halten. Wenn Sie wissen, wie die Parameter auf Ihrer Website funktionieren, teilen Sie Google mit, wie sie verarbeitet werden sollen.
  • Stellen Sie sicher, dass der Hostserver Ihrer Website nicht offline, überlastet oder falsch konfiguriert ist.
    Treten weiterhin Probleme mit der Verbindung, mit Zeitüberschreitungen oder mit Reaktionszeiten auf, sollten Sie sich an Ihren Webhosting-Anbieter wenden und überlegen, die Kapazität Ihrer Website zu erhöhen, damit mehr Zugriffe verarbeitet werden können.
  • Vergewissern Sie sich, dass Sie Google nicht versehentlich blockieren.
    Eventuell blockieren Sie Google aufgrund eines Systemfehlers. Hierbei könnte es sich um einen DNS-Konfigurationsfehler, eine Firewall bzw. ein DoS-Schutzsystem mit falscher Konfiguration oder um die Konfiguration eines Content-Management-Systems handeln. Schutzsysteme sind ein wichtiger Bestandteil von gutem Hosting und werden häufig so konfiguriert, dass ein ungewöhnlich hohes Aufkommen an Serveranfragen automatisch blockiert wird. Da der Googlebot häufig mehr Anfragen als ein gewöhnlicher Nutzer stellt, kann es passieren, dass er die Schutzsysteme auslöst, dann blockiert wird und Ihre Website nicht mehr crawlen kann. Um dieses Problem zu beheben, ermitteln Sie, durch welchen Bestandteil der Infrastruktur der Website der Googlebot blockiert wird, und ändern Sie die Konfiguration entsprechend. Wenden Sie sich an Ihren Hostanbieter, wenn Sie die Firewalleinstellungen nicht selbst anpassen können.
  • Steuern Sie das Crawling und die Indexierung Ihrer Website durch Suchmaschinen auf sinnvolle Weise.
    Einige Webmaster verhindern absichtlich, dass der Googlebot auf Ihre Websites zugreift, etwa durch eine Firewall. Meist steht dahinter nicht das Ziel, den Googlebot völlig zu blockieren, sondern zu steuern, wie die Website gecrawlt und indexiert wird. Trifft dies auf Sie zu, überprüfen Sie Folgendes: Wenn Sie ändern möchten, wie oft der Googlebot Ihre Website crawlt, passen Sie die Crawling-Frequenz an. Hostanbieter können außerdem die Inhaberschaft ihrer IP-Adressen verifizieren.

Fehler bei der Serververbindung

Fehlertyp Beschreibung
Zeitüberschreitung

Beim Warten des Servers auf die Anfrage ist es zu einer Zeitüberschreitung gekommen.

Verwenden Sie das Tool Abruf wie durch Google, um herauszufinden, ob der Googlebot Ihre Website zurzeit crawlen kann. Wenn das Tool den Inhalt Ihrer Startseite problemlos zurückgibt, können Sie davon ausgehen, dass der Googlebot grundsätzlich in der Lage ist, ordnungsgemäß auf Ihre Website zuzugreifen

Eventuell ist Ihr Server überlastet oder falsch konfiguriert. Sollte das Problem weiterhin bestehen, wenden Sie sich an Ihren Hostanbieter.

Gekürzte Header

Google konnte eine Verbindung zu Ihrem Server herstellen, aber die Verbindung wurde unterbrochen, bevor vollständige Header gesendet wurden. Bitte versuchen Sie es später erneut.

Verwenden Sie das Tool Abruf wie durch Google, um herauszufinden, ob der Googlebot Ihre Website zurzeit crawlen kann. Wenn das Tool den Inhalt Ihrer Startseite problemlos zurückgibt, können Sie davon ausgehen, dass der Googlebot grundsätzlich in der Lage ist, ordnungsgemäß auf Ihre Website zuzugreifen

Eventuell ist Ihr Server überlastet oder falsch konfiguriert. Sollte das Problem weiterhin bestehen, wenden Sie sich an Ihren Hostanbieter.

Verbindung zurückgesetzt

Der Server hat die Anfrage von Google verarbeitet, gibt jedoch keine Inhalte zurück, da die Verbindung mit dem Server zurückgesetzt wurde. Bitte versuchen Sie es später erneut.

Verwenden Sie das Tool Abruf wie durch Google, um herauszufinden, ob der Googlebot Ihre Website zurzeit crawlen kann. Wenn das Tool den Inhalt Ihrer Startseite problemlos zurückgibt, können Sie davon ausgehen, dass der Googlebot grundsätzlich in der Lage ist, ordnungsgemäß auf Ihre Website zuzugreifen

Eventuell ist Ihr Server überlastet oder falsch konfiguriert. Sollte das Problem weiterhin bestehen, wenden Sie sich an Ihren Hostanbieter.

Gekürzte Antwort

Ihr Server hat die Verbindung unterbrochen, bevor wir eine vollständige Antwort erhalten konnten, und der Text der Antwort scheint gekürzt zu sein.

Verwenden Sie das Tool Abruf wie durch Google, um herauszufinden, ob der Googlebot Ihre Website zurzeit crawlen kann. Wenn das Tool den Inhalt Ihrer Startseite problemlos zurückgibt, können Sie davon ausgehen, dass der Googlebot grundsätzlich in der Lage ist, ordnungsgemäß auf Ihre Website zuzugreifen

Eventuell ist Ihr Server überlastet oder falsch konfiguriert. Sollte das Problem weiterhin bestehen, wenden Sie sich an Ihren Hostanbieter.

Verbindung zurückgewiesen

Google konnte nicht auf Ihre Website zugreifen, weil der Server die Verbindung zurückgewiesen hat. Eventuell blockiert Ihr Hostanbieter den Googlebot oder die Firewall ist falsch konfiguriert.

Verwenden Sie das Tool Abruf wie durch Google, um herauszufinden, ob der Googlebot Ihre Website zurzeit crawlen kann. Wenn das Tool den Inhalt Ihrer Startseite problemlos zurückgibt, können Sie davon ausgehen, dass der Googlebot grundsätzlich in der Lage ist, ordnungsgemäß auf Ihre Website zuzugreifen

Eventuell ist Ihr Server überlastet oder falsch konfiguriert. Sollte das Problem weiterhin bestehen, wenden Sie sich an Ihren Hostanbieter.

Fehler beim Verbindungsaufbau

Google konnte keine Verbindung zu Ihrem Server herstellen, da das Netzwerk nicht erreichbar oder ausgefallen ist.

Eventuell ist Ihr Server überlastet oder falsch konfiguriert. Sollte das Problem weiterhin bestehen, wenden Sie sich an Ihren Hostanbieter.

Verwenden Sie das Tool Abruf wie durch Google, um herauszufinden, ob der Googlebot Ihre Website zurzeit crawlen kann. Wenn das Tool den Inhalt Ihrer Startseite problemlos zurückgibt, können Sie davon ausgehen, dass der Googlebot grundsätzlich in der Lage ist, ordnungsgemäß auf Ihre Website zuzugreifen

Zeitüberschreitung beim Verbindungsaufbau

Google konnte keine Verbindung zu Ihrem Server herstellen.

Verwenden Sie Abruf wie durch Google, um herauszufinden, ob der Googlebot Ihre Website derzeit crawlen kann. Wenn "Abruf wie durch Google" den Inhalt Ihrer Startseite problemlos zurückgibt, können Sie davon ausgehen, dass der Googlebot grundsätzlich in der Lage ist, ordnungsgemäß auf Ihre Website zuzugreifen.

Überprüfen Sie, ob Ihr Server mit dem Internet verbunden ist. Eventuell ist Ihr Server überlastet oder falsch konfiguriert. Sollte das Problem weiterhin bestehen, wenden Sie sich an Ihren Hostanbieter.

Keine Antwort

Google konnte eine Verbindung zu Ihrem Server herstellen, diese wurde jedoch beendet, bevor Daten vom Server gesendet werden konnten.

Verwenden Sie Abruf wie durch Google, um herauszufinden, ob der Googlebot Ihre Website derzeit crawlen kann. Wenn "Abruf wie durch Google" den Inhalt Ihrer Startseite problemlos zurückgibt, können Sie davon ausgehen, dass der Googlebot grundsätzlich in der Lage ist, ordnungsgemäß auf Ihre Website zuzugreifen.

Möglicherweise ist Ihr Server überlastet oder falsch konfiguriert. Sollte das Problem weiterhin bestehen, wenden Sie sich an Ihren Hostanbieter.

Robots-Fehler

Was sind Robots-Fehler?

Dabei handelt es sich um Fehler beim Abrufen der robots.txt-Datei Ihrer Website. Bevor der Googlebot Ihre Website crawlt sowie ungefähr einmal täglich nach dem Crawling, greift er auf Ihre robots.txt-Datei zu, um zu ermitteln, welche Seiten nicht gecrawlt werden sollen. Ist Ihre robots.txt-Datei vorhanden, aber nicht erreichbar, d. h., wenn kein HTTP-Statuscode 200 oder 404 zurückgegeben wird, wird das Crawling verschoben, um zu vermeiden, unerwünschte URLs zu crawlen. Sobald der Zugriff auf Ihre robots.txt-Datei möglich ist, wird Ihre Website erneut vom Googlebot besucht und gecrawlt. Weitere Informationen über das Protokoll zum Ausschluss von Robots

Fehler in der robots.txt-Datei beheben

  • Es ist nicht immer eine robots.txt-Datei erforderlich.
    Sie benötigen die robots.txt-Datei nur, falls Ihre Website Inhalte aufweist, die nicht von den Suchmaschinen indexiert werden sollen. Wenn Sie möchten, dass Suchmaschinen alle Ihre Websiteinhalte indexieren, benötigen Sie keine robots.txt-Datei – nicht einmal eine leere. Ist keine robots.txt-Datei für Ihre Website vorhanden, gibt Ihr Server den Statuscode 404 zurück, sobald der Googlebot die Datei anfordert, und Google fährt mit dem Crawling Ihrer Website fort. Das ist kein Problem.
  • Stellen Sie sicher, dass Google Zugriff auf Ihre robots.txt-Datei hat.
    Unter Umständen wird beim Versuch, auf Ihre robots.txt-Datei zuzugreifen, eine 5xx-Fehlermeldung (unerreichbar) zurückgegeben. Vergewissern Sie sich, dass der Googlebot nicht von Ihrem Hostanbieter  oder Ihren Firewalleinstellungen blockiert wird.

URL-Fehler

Der Bereich "URL-Fehler" des Berichts ist in Kategorien unterteilt, die die wichtigsten 1.000 URL-Fehler für die jeweilige Kategorie enthalten. Nicht alle Fehler, die Sie hier sehen, erfordern Maßnahmen Ihrerseits. Es ist jedoch wichtig, dass Sie in diesem Bereich nach Fehlern suchen, die sich negativ auf die Nutzererfahrung und auf die Google-Crawler auswirken können. Wir haben es Ihnen leicht gemacht, indem wir die wichtigsten Probleme ganz oben auflisten, nach der Anzahl der Fehler und der Seiten, die auf die URL verweisen. Insbesondere sollten Sie Folgendes beachten:

  • Beheben Sie Fehler des Typs "Nicht gefunden" für wichtige URLs mit 301-Weiterleitungen. 404-Fehler (Nicht gefunden) sind zwar normal, Sie sollten jedoch folgende Fehler beheben: Fehler für wichtige Seiten, die mit anderen Websites verknüpft sind; Fehler bei älteren URLs, die in Ihre Sitemap aufgenommen, aber seitdem gelöscht wurden; Fehler aufgrund von falsch geschriebenen URLs für wichtige Seiten oder Fehler bei URLs beliebter Seiten, die nicht mehr auf Ihrer Website existieren. Wenn Sie diese Fehler beheben, sind wichtige Informationen leicht für Google und Ihre Websitebesucher zugänglich.
  • Aktualisieren Sie Ihre Sitemaps.  Entfernen Sie alte URLs aus Ihren Sitemaps. Wenn Sie neue Sitemaps hinzufügen, um ältere zu ersetzen, stellen Sie sicher, dass Sie diese auch wirklich löschen, anstatt eine Weiterleitung zu den neuen einzurichten.  
  • Weiterleitungen sollten übersichtlich und kurz sein.  Eventuell nutzen Sie mehrere URLs, die Nutzer in einer bestimmten Reihenfolge weiterleiten (z. B. Seite A > Seite B > Seite C > Seite D). In diesem Fall fällt es dem Googlebot schwer, der Reihenfolge zu folgen und diese auszuwerten.  Verwenden Sie daher so wenige Weiterleitungen wie möglich.  Weitere Informationen zum Fehlertyp "Nicht gefolgt"

URL-Fehlerdetails einsehen

Für das Abrufen von URL-Fehlern gibt es mehrere Möglichkeiten:

  • Klicken Sie auf Download, um eine Liste der 1.000 häufigsten Fehler für diesen Crawler-Typ abzurufen, z. B. für Desktop oder Smartphone.
  • Verwenden Sie den Filter über der Tabelle, um spezifische URLs zu finden.
  • Sehen Sie sich die Fehlerdetails an, indem Sie den Link einzelner URLs oder App-URIs aufrufen.
Details für Desktop- oder Smartphone-URL-Fehler enthalten Statusinformationen zum Fehler, eine Liste von Seiten, von denen auf die URL verwiesen wird, und einen Link zu Abruf wie durch Google, damit Sie die Fehlerbehebung für diese URL durchführen können.

URL-Fehler als behoben markieren

Nachdem Sie das Problem behoben haben, das zu einem Fehler für eine bestimmte URL geführt hat, können Sie diese aus der Liste ausblenden. Sie können dies einzeln oder für mehrere auf einmal vornehmen. Aktivieren Sie das Kontrollkästchen neben der URL und klicken Sie auf Als korrigiert markieren. Die URL wird daraufhin aus der Liste entfernt.

Wurde der Fehler nicht behoben, erscheint die URL wieder in der Liste, nachdem Google Ihre Website das nächste Mal gecrawlt hat, auch wenn Sie den Fehler als korrigiert markiert haben.

URL-Fehlertypen

Häufige URL-Fehler
Fehlertyp Beschreibung
Serverfehler

Wenn diese Fehler für Ihre URLs zurückgegeben werden, konnte der Googlebot nicht auf die URLs zugreifen, es kam zu einer Zeitüberschreitung bei der Anfrage oder Ihre Website war nicht verfügbar. Daher war der Googlebot gezwungen, die Anfrage abzubrechen.

Weitere Informationen zu Serververbindungsfehlern

Soft 404

Wenn ein Besucher auf Ihrer Website eine nicht vorhandene Seite anfordert, gibt der Webserver in der Regel einen 404-Fehler (Nicht gefunden) zurück. Dieser HTTP-Antwortcode teilt sowohl Browsern als auch Suchmaschinen mit, dass die Seite nicht vorhanden ist. Daher wird der Inhalt der Seite (falls vorhanden) nicht von Suchmaschinen gecrawlt oder indexiert.

Ein Soft 404-Fehler tritt auf, wenn Ihr Server eine reale Seite für eine URL zurückgibt, die auf Ihrer Website gar nicht vorhanden ist. Dies geschieht meist, wenn Ihr Server fehlerhafte oder nicht vorhandene URLs als korrekt betrachtet und den Nutzer auf eine gültige Seite weiterleitet, z. B. auf eine Startseite oder auf eine benutzerdefinierte 404-Seite.  

Dies führt zu Problemen, weil Suchmaschinen einen Großteil ihrer Zeit damit verbringen, oftmals doppelt vorhandene URLs auf Ihrer Website zu crawlen und zu indexieren. Das kann sich negativ auf das Crawling Ihrer Website auswirken, weil die richtigen, eindeutigen URLs möglicherweise nicht so schnell erkannt oder seltener besucht werden, da der Googlebot so viel Zeit für nicht vorhandene Seiten aufwendet.

Wir empfehlen Ihnen, grundsätzlich den Fehlercode 404 (Nicht gefunden) oder 410 (Entfernt) als Antwort auf eine Anfrage einer nicht vorhandenen Seite zurückzugeben. Sie können die Nutzererfahrung verbessern, indem Sie Ihre Website so konfigurieren, dass eine benutzerdefinierte 404-Seite angezeigt wird, wenn ein 404-Antwortcode zurückgegeben wird. Beispielsweise könnten Sie eine Seite mit einer Liste Ihrer am häufigsten besuchten Seiten, einem Link zu Ihrer Startseite oder einem Feedback-Link einrichten. Es reicht jedoch nicht aus, einfach eine Seite mit einer 404-Nachricht zu erstellen. Sie müssen außerdem den richtigen HTTP-Antwortcode 404 oder 410 zurückgeben.

404

Google findet Webinhalte durch das Verfolgen von Links von einer Seite zur nächsten. Im Allgemeinen wird eine Fehlermeldung des Typs "Nicht gefunden" – gewöhnlich ein HTTP-Statuscode 404 – zurückgegeben, wenn die Seite nicht existiert, auf die der Googlebot zugreifen will. Entweder wurde die Seite gelöscht oder umbenannt, ohne dass Nutzer von der alten URL auf die neue Seite weitergeleitet werden, oder der Link enthält einen Tippfehler.

Fehler des Typs "Nicht gefunden" beheben

Normalerweise wirken sich 404-Fehler nicht auf das Ranking Ihrer Website in Google aus und können problemlos ignoriert werden. Meistens beruhen sie auf Tippfehlern oder falschen Konfigurationen. Als Beispiel wären hier Links zu nennen, die automatisch von einem CMS (Content Management System) erstellt werden. Zudem treten die Fehler auf, da sich Google verstärkt bemüht, Links in eingebetteten Inhalten wie JavaScript zu erkennen und zu crawlen.  Im Folgenden finden Sie einige Ansätze für die Überprüfung:

  • Im Bereich Über diese Seiten verlinkt sehen Sie, woher die ungültigen Links stammen. Klicken Sie auf die URL, um den Link zu öffnen.
  • Korrigieren oder löschen Sie Links von Ihrer eigenen Website.
  • Mit 301-Weiterleitungen können Sie absichtliche Zugriffe über falsch geschriebenen Links auf anderen Websites erfassen.
    Wenn eine legitime URL einen Fehler enthält, z. B. www.ihrebeispielurl.de/roteshue statt www.ihrebeispielurl.de/roteschuhe, liegt das meistens an einem Tippfehler, den jemand beim Erstellen des Links auf Ihre Website eingegeben hat. In diesem Fall können Sie die fehlerhafte URL in Ihrer Serverkonfiguration erfassen und eine 301-Weiterleitung zur korrekten URL erstellen. Sie können auch Kontakt mit dem Webmaster der Website mit einem fehlerhaften Link aufnehmen und darum bitten, dass der Link aktualisiert oder entfernt wird.

404-Fehler sind ganz normal und erfüllen im Web eine sinnvolle Funktion. Sie werden wahrscheinlich niemals jeden einzelnen Link auf Ihre Website unter Kontrolle haben oder jeden in der Search Console aufgeführten 404-Fehler beheben können. Ermitteln Sie stattdessen einfach die wichtigsten Probleme und beheben Sie diese nach Möglichkeit.

Wann ein 404-Statuscode zurückgegeben werden sollte

Wenn Sie eine Seite von Ihrer Website entfernen, überlegen Sie sich, ob Sie die betreffenden Inhalte an eine andere Stelle verschieben oder gänzlich entfernen möchten. 

  • Wenn Sie Inhalte zu einer neuen URL verschieben, können Sie eine Weiterleitung über die alte URL erstellen. Besuchen Nutzer dann die alte URL, um nach diesen Inhalten zu suchen, werden sie automatisch zur neuen URL weitergeleitet.
  • Wenn Sie Inhalte komplett löschen und sie nicht durch neue ersetzen möchten, können Sie festlegen, dass die alte URL einen 404- oder 410-Fehler zurückgibt. Zurzeit behandelt Google den Code 410 ("Entfernt") wie den Code 404 ("Nicht gefunden"). 

Werden anstelle von 404 oder 410 andere Codes für nicht vorhandene Seiten zurückgegeben oder Nutzer auf eine andere Seite (z. B. die Startseite) weitergeleitet, können Probleme auftreten. Solche Seiten werden als Soft 404-Fehler bezeichnet und können für Nutzer und Suchmaschinen verwirrend sein.

Unerwartete 404-Fehler

Bei den Crawling-Fehlern werden gelegentlich 404-Fehler für URLs aufgeführt, die Ihrer Meinung nach nicht auf Ihrer eigenen Website oder im Web existieren. Diese unerwarteten URLs können eventuell vom Googlebot generiert werden, der versucht hat, Links zu folgen, die er in JavaScript, Flash-Dateien oder anderen eingebetteten Inhalten gefunden hat.

Beispielsweise können Sie für Ihre Website den folgenden Code verwenden, um Dateidownloads in Google Analytics zu verfolgen:

<a href="helloworld.pdf"
  onClick="_gaq.push(['_trackPageview','/download-helloworld']);">
  Hello World PDF</a>

Hier würde der Googlebot versuchen, die URL http://www.ihrebeispielurl.de/download-helloworld zu crawlen, obwohl es sich nicht um eine richtige Seite handelt. In diesem Fall kann der Link in der Search Console-Funktion "Crawling-Fehler" als 404-Fehler ("Nicht gefunden") angezeigt werden.

Google versucht, diese Fehlertypen zu erkennen und zu beheben, damit sie nicht mehr in den Crawling-Fehlern aufgeführt werden. 

Zugriff verweigert

In der Regel findet Google Webinhalte durch das Verfolgen von Links von einer Seite zur anderen. Damit der Googlebot eine Seite crawlen kann, muss er darauf zugreifen können. Wenn unerwartet Fehler vom Typ "Zugriff verweigert" auftreten, kann das folgende Ursachen haben:

  • Der Googlebot konnte nicht auf eine URL Ihrer Website zugreifen, da eine Anmeldung erforderlich ist, um einige oder alle Inhalte anzusehen.
  • Ihre robots.txt-Datei blockiert den Zugriff von Google auf Ihre Website oder einzelne URLs oder Verzeichnisse.
  • Ihr Server erfordert, dass die Nutzer sich über einen Proxy authentifizieren, oder Ihr Hostanbieter verwehrt Google möglicherweise den Zugriff auf Ihre Website.

Fehlerbehebung:

  • Testen Sie, ob Ihre robots.txt-Datei ordnungsgemäß funktioniert und stellen Sie sicher, dass Google nicht blockiert wird. Mit dem Tool zum Testen der robots.txt-Datei können Sie genau feststellen, wie der Googlebot den Inhalt Ihrer robots.txt-Datei interpretiert. Der Google-User-Agent ist der Googlebot. 
  • Verwenden Sie das Tool Abruf wie durch Google, um genau nachzuvollziehen, wie der Googlebot Ihre Website sieht. Dies kann beim Beheben von Problemen mit den Inhalten Ihrer Website oder der Sichtbarkeit in den Suchergebnissen nützlich sein.
Nicht aufgerufen

Fehler des Typs "Nicht aufgerufen" werden für URLs zurückgegeben, denen Google nicht vollständig folgen konnte. Außerdem enthalten Sie Informationen zu den Ursachen. Wenn der Googlebot nicht dem vollständigen Pfad von URLs auf Ihrer Website folgen konnte, kann das folgende Ursachen haben:

Flash, JavaScript, aktive Inhalte

Einige Funktionen, wie JavaScript, Cookies, Sitzungs-IDs, Frames, DHTML oder Flash können es Suchmaschinen erschweren, Ihre Seite zu crawlen. Überprüfen Sie Folgendes:

  • Überprüfen Sie Ihre Website mit einem Textbrowser wie Lynx, da Ihre Website für viele Suchmaschinen so dargestellt wird wie in Lynx. Wenn aufgrund von Funktionen wie JavaScript, Cookies, Sitzungs-IDs, Frames, DHTML oder Flash verhindert wird, dass Sie Ihre gesamte Website in einem Textbrowser ansehen können, treten beim Durchsuchen Ihrer Website durch Suchmaschinen-Spider möglicherweise Probleme auf.
  • Mit dem Tool Abruf wie durch Google können Sie genau nachvollziehen, wie der Googlebot Ihre Website sieht.
  • Beachten Sie bei der Verwendung dynamischer Seiten, also zum Beispiel bei Seiten, deren URL ein Fragezeichen (?) enthält, dass nicht alle Suchmaschinen sowohl statische als auch dynamische Seiten crawlen. Im Allgemeinen empfehlen wir, Parameter sparsam zu verwenden und möglichst kurz zu halten. Wenn Sie wissen, wie die Parameter auf Ihrer Website funktionieren, teilen Sie Google mit, wie diese verarbeitet werden sollen.

Weiterleitungen

  • Falls Sie dauerhaft Weiterleitungen von einer Seite zu einer anderen ausführen, verwenden Sie den richtigen HTTP-Statuscode, also 301 – Dauerhaft verschoben.
  • Verwenden Sie nach Möglichkeit absolute statt relative Links. Wenn Sie beispielsweise Links zu einer anderen Seite Ihrer Website erstellen, sollten Sie einen Link zu www.ihrebeispielurl.de/meinseite.html statt nur zu meineseite.html erstellen.
  • Idealerweise sollte jede Seite Ihrer Website über mindestens einen statischen Textlink zugänglich sein. Verringern Sie allgemein die Anzahl der Weiterleitungen, die zum Verfolgen eines Links von einer Seite zu einer anderen erforderlich sind.
  • Überprüfen Sie, ob Ihre Weiterleitungen auf die richtigen Seiten verweisen. Manchmal stoßen wir auf Weiterleitungen, die auf ungültige URLs oder auf sich selbst verweisen. Durch Letzteres entstehen Loop-Fehler.
  • Nehmen Sie keine weitergeleiteten URLs in Ihre Sitemaps auf.
  • URLs sollten so kurz wie möglich sein. Hängen Sie nicht automatisch Informationen wie Sitzungs-IDs an Ihre Weiterleitungs-URLs an.
  • Vergewissern Sie sich, dass Suchrobots Ihre Website ohne Sitzungs-IDs und ohne Argumente, die ihren Weg durch die Website aufzeichnen, crawlen können.
DNS-Fehler

Wird dieser Fehler für URLs zurückgegeben, konnte der Googlebot entweder nicht mit dem DNS-Server kommunizieren oder der Server hatte keinen Eintrag für Ihre Website.

Weitere Informationen zu DNS-Fehlern

Für mobile Seiten spezifische URL-Fehler (Smartphone)
Fehler Beschreibung
Fehlerhafte Weiterleitungen

Der Fehler Fehlerhafte Weiterleitung wird auf der Seite Crawling > Crawling-Fehler im Abschnitt URL-Fehler auf dem Tab Smartphones angezeigt.

Einige Websites verwenden separate URLs für Desktop- und Smartphone-Nutzer. Zudem sind Desktop-Seiten unter Umständen so konfiguriert, dass Smartphone-Nutzer zur mobilen Website weitergeleitet werden, etwa m.ihrebeispielurl.de. Eine fehlerhafte Weiterleitung tritt auf, wenn Smartphone-Nutzer von einer Desktop-Seite zu einer mobilen Webseite weitergeleitet werden, die nicht für ihre Suchanfrage relevant ist. Ein typisches Beispiel: Alle Seiten der Desktop-Website leiten Smartphone-Nutzer zur Startseite der für Smartphones optimierten Website weiter. In der folgenden Abbildung sind die fehlerhaften Weiterleitungen durch einen roten Pfeil gekennzeichnet:


Diese Art der Weiterleitung unterbricht das Surfen der Nutzer und kann dazu führen, dass sie diese Website nicht mehr besuchen und sich stattdessen auf anderen Websites umsehen. Wenn unsere Systeme erkennen, dass Smartphone-Nutzer zu einer Startseite statt zu einer relevanten URL weitergeleitet werden, wird ein entsprechender Hinweis in den Suchergebnissen eingeblendet:

Eventuell wird die Startseite der Website geöffnet.

Der Nutzer kann auf Trotzdem versuchen klicken, um die Seite zu öffnen. Selbst wenn er letztlich die richtige Seite auf der für Smartphones optimierten Website findet, erhöhen irrelevante Weiterleitungen den Aufwand beim Surfen. Das ist besonders für Nutzer in langsameren Mobilfunknetzen lästig. Fehlerhafte Weiterleitungen sind nicht nur frustrierend für die Nutzer, sondern können auch zu Problemen mit unseren Crawling-, Indexierungs- und Ranking-Algorithmen führen.

Im Folgenden finden Sie einige Tipps, mit denen Sie das Sucherlebnis für Mobilgeräte optimieren und fehlerhafte Weiterleitungen vermeiden können:

  • Führen Sie einige Suchanfragen auf Ihrem Smartphone aus oder konfigurieren Sie Ihren Browser so, dass er sich wie ein Smartphone verhält, um zu sehen, wie Ihre Website reagiert.
  • Nutzen Sie die Beispiel-URLs aus dem Bericht als Ansatz, um das Debugging genau an dem Punkt durchzuführen, an dem das Problem in der Serverkonfiguration besteht.
  • Richten Sie Ihren Server so ein, dass Smartphone-Nutzer zur entsprechenden URL auf Ihrer mobilen Website weitergeleitet werden.
  • Falls für eine Seite auf Ihrer Website keine mobile Version vorhanden ist, verwenden Sie die Desktop-Seite und leiten Sie Nutzer nicht zur Startseite der für Smartphones optimierten Website weiter. In diesem Fall ist es besser, nichts zu tun, anstatt das Falsche zu tun.
  • Ziehen Sie Responsive Webdesign in Betracht, über das für Desktop- und Smartphone-Nutzer dieselben Inhalte bereitgestellt werden.
  • Lesen Sie unsere Empfehlungen zur Verwendung separater URLs für Desktop- und Smartphone-Nutzer.
URLs für Smartphones blockiert

Der Fehler "Blockiert" wird auf dem Tab "Smartphones" auf der Seite Crawling > Crawling-Fehler im Abschnitt "URL-Fehler" angezeigt. Wird der Fehler für eine URL auf Ihrer Website zurückgegeben, wurde die URL in Ihrer robots.txt-Datei für den Smartphone-Googlebot blockiert.

Dies ist nicht unbedingt ein für Smartphones spezifischer Fehler; die entsprechenden Desktop-Seiten könnten ebenfalls blockiert sein. Er weist jedoch häufig darauf hin, dass die robots.txt-Datei geändert werden muss, damit URLs für Smartphones gecrawlt werden können. Wenn die Smartphone-fähigen URLs blockiert sind, können die Seiten für Mobilgeräte nicht gecrawlt werden und werden möglicherweise nicht in den Suchergebnissen angezeigt.

Wenn Sie für URLs Ihrer Website den Smartphone-Crawling-Fehler "Blockiert" erhalten, untersuchen Sie die robots.txt-Datei Ihrer Website und vergewissern Sie sich, dass Sie nicht versehentlich Teile Ihrer Website für das Crawlen durch den Smartphone-Googlebot blockieren.

Weitere Informationen finden Sie in unseren Empfehlungen.

Flash-Inhalte

Der Fehler Flash-Inhalte wird auf der Seite Crawling > Crawling-Fehler im Abschnitt URL-Fehler auf dem Tab Smartphones angezeigt.

Unsere Algorithmen geben für die URLs in diesem Abschnitt an, dass ihr Inhalt überwiegend im Flash-Format gerendert wird. Auf vielen Geräten können diese Seiten nicht gerendert werden, da Flash von iOS und Android-Versionen ab 4.1 nicht unterstützt wird. Den Nutzern dieser Betriebssysteme wird außerdem in den Suchergebnissen von Google folgender Hinweis angezeigt:

Verwendet Flash. Funktioniert auf Ihrem Gerät möglicherweise nicht.

Mithilfe des Responsive Webdesign können Sie Ihre Website für die Nutzer von Mobilgeräten optimieren. Google empfiehlt dies zur Erstellung nutzerfreundlicher Websites für alle Geräte.  In Web Fundamentals, einer umfassenden Ressource zur Webentwicklung für alle Gerätetypen, können Sie mehr zu diesem Thema erfahren.

Unabhängig davon, wie Sie an das Problem herangehen, sollten Sie sicherstellen, dass der Googlebot auf alle Assets Ihrer Websites (CSS, JavaScript und Bilder) zugreifen kann und sie nicht durch die robots.txt-Datei oder in anderer Form blockiert werden. Unsere Algorithmen benötigen diese externen Dateien, um die Designkonfiguration Ihrer Website zu erfassen und entsprechend zu behandeln. Verwenden Sie die Funktion Abruf wie durch Google in der Search Console, um zu prüfen, ob unsere Indexierungsalgorithmen auf Ihre Website zugreifen können.

Fehler in Google News

 

Verlage und Webpublisher können Fehlerberichte speziell für Google News erhalten, wenn ihre Website bei Google News registriert ist, sie ein Search Console-Konto haben und ihre Website diesem Konto hinzugefügt haben. Trifft all dies zu, gehen Sie in der Search Console wie folgt vor:

  • Klicken Sie auf der Startseite auf die URL der Website.
  • Klicken Sie auf dem Dashboard auf Crawling > Crawling-Fehler.
  • Klicken Sie auf den Tab News, um die Crawling-Fehler für die News-Inhalte anzusehen.
  • Crawling-Fehler werden in Kategorien eingeteilt, etwa "Artikelextraktion" oder "Fehler im Titel". Wenn Sie auf eine dieser Kategorien klicken, erscheint eine Liste betroffener URLs zusammen mit den jeweiligen Crawling-Fehlern, die sie verursachen.
Hinweis: Der News-Index wird mithilfe von Computeralgorithmen erstellt. Wir versuchen, so viele Ihrer Inhalte wie möglich zu berücksichtigen, können aber nicht garantieren, dass alle Artikel aufgenommen werden. Vielen Dank für Ihr Verständnis.
Fehler Beschreibung
Artikel ist unverhältnismäßig kurz

Der von uns aus der HTML-Seite extrahierte Artikeltext ist im Vergleich zu anderen Textabschnitten ohne Links auf der Seite zu kurz. Dies gilt für die meisten Seiten, die Kurznachrichten oder Multimedia-Inhalte anstelle von vollständigen Nachrichtenartikeln enthalten. Dieser Fehler wurde generiert, um die Aufnahme eines möglicherweise fehlerhaften Texts zu vermeiden.

Empfehlungen

Dieses Problem tritt oft aus den folgenden Gründen auf:

  • Zu viele Snippets für verwandte Artikel – Ziehen Sie in Betracht, diese Snippets klickbar zu machen, damit unser Extrahierer besser funktioniert.
  • Funktionen wie "Diesen Artikel an Freunde senden" mit langen Beschreibungen – Zur Vermeidung des Fehlers können Sie die Stile "display:none" oder "visibility:hidden" einstellen, damit der Text unsichtbar wird, oder den HTML-Code von JavaScript dynamisch schreiben lassen.
  • Nutzerkommentare – Zur Vermeidung dieses Fehlers können Sie die Kommentare in einen iFrame einbetten, sie dynamisch mit AJAX abrufen oder sie auf eine angrenzende Seite verschieben.
Artikel ist fragmentiert

Der von uns aus der HTML-Seite extrahierte Artikeltext besteht aus einzelnen Sätzen, die nicht in Abschnitte gegliedert sind. Dieser Fehler wurde generiert, um die Aufnahme eines möglicherweise fehlerhaften Texts zu vermeiden.

Empfehlungen

  • Achten Sie darauf, dass jeder Absatz mehr als einen Satz enthält.
  • Achten Sie auf die korrekte Zeichensetzung in Ihren Sätzen.
  • Verwenden Sie innerhalb der Absätze nicht allzu häufig die Tags <br> und <p> und vermeiden Sie es, den Artikeltext in viele kleine Abschnitte aufzuteilen.
  • Entfernen Sie einen Teil des Texts, der nicht zum Artikel gehört, von der Artikelseite.
Artikel zu lang

Der von uns aus der HTML-Seite extrahierte Artikeltext ist zu lang für einen Nachrichtenartikel. Dieser Fehler wurde generiert, um die Aufnahme eines möglicherweise fehlerhaften Texts zu vermeiden. Häufig handelt es sich hierbei um Nachrichtenartikel mit Nutzerkommentaren unter dem Artikel oder um HTML-Layouts, die weitere Materialien außer dem Artikel selbst enthalten.

Empfehlungen

Sie haben auch die Möglichkeit, einen Teil des Textes, der nicht zum Artikel gehört, von der Artikelseite zu entfernen. Wenn die Artikelseite Nutzerkommentare enthält, können Sie Folgendes tun:

  • Einen Iframe einbetten
  • Kommentare dynamisch mit AJAX abrufen
  • Einige Kommentare auf eine angrenzende Seite verschieben
Artikel ist zu kurz

Der von uns aus der HTML-Seite extrahierte Artikeltext enthält zu wenig Wörter für einen Nachrichtenartikel. Dies gilt für die meisten Seiten, die Kurznachrichten oder Multimedia-Inhalte anstelle von vollständigen Nachrichtenartikeln enthalten. Dieser Fehler wurde generiert, um die Aufnahme eines möglicherweise fehlerhaften Texts zu vermeiden.

Empfehlungen

  • Gliedern Sie Ihre Artikel in Absätze mit einigen wenigen Sätzen. Wenn der Artikel zu wenige Wörter für einen Nachrichtenartikel enthält, können wir ihn nicht aufnehmen.
  • Stellen Sie sicher, dass Ihre Artikel mehr als 80 Wörter enthalten.
Datum nicht gefunden

Das Veröffentlichungsdatum des Artikels konnte nicht ermittelt werden.

Empfehlungen

Folgen Sie diesen Empfehlungen für das Datumsformat:

  • Geben Sie ein genaues Datum und eine genaue Uhrzeit für jeden Ihrer Artikel zwischen dem Titel und dem Text des Artikels in einer separaten HTML-Zeile an. Das Datum sollte angeben, wann der Artikel zum ersten Mal veröffentlicht wurde.
  • Entfernen Sie alle anderen Datumsangaben aus dem HTML-Code der Artikelseite, sodass der Crawler diese nicht versehentlich als Veröffentlichungsdatum ansieht.
  • Wenn Sie ein Meta-Tag für das Datum verwenden möchten, setzen Sie sich bitte vorher mit uns in Verbindung. Meta-Tags für das Datum sollten in folgendem Format vorliegen: <meta name="DC.date.issued" content="JJJJ-MM-TT">. Dabei wird das Datum im W3C-Format angegeben, entweder als vollständiges Datum (JJJJ-MM-TT) oder als vollständiges Datum mit Stunden, Minuten und Sekunden und angehängter Zeitzone (JJJJ-MM-TTThh:mm:ssTZD).
  • Erstellen Sie eine Google News-Sitemap. Mit dem Tag <publication_date> können wir das korrekte Datum für Ihre Artikel ermitteln.
Datum zu alt

Das Datum, das wir für diesen Artikel über ein <publication_date>-Tag in der Sitemap oder über ein Datum in der HTML-Seite ermittelt haben, liegt zu weit zurück.

Empfehlungen

  • Achten Sie darauf, dass Ihr Artikel höchstens zwei Tage alt ist. Zurzeit erfassen wir nur Artikel, die maximal zwei Tage alt sind.
  • Folgen Sie den zuvor erwähnten Empfehlungen für das Datumsformat.
Leerer Artikel

Der von uns aus der HTML-Seite extrahierte Artikeltext ist leer.

Empfehlungen

  • Vergewissern Sie sich, dass der vollständige Text Ihrer Artikel im Quellcode der Artikelseite enthalten und nicht etwa in einer JavaScript-Datei oder einen Iframe eingebettet ist.
  • Stellen Sie sicher, dass Sie keinen Stil im Quellcode Ihrer Artikel verwenden, wie etwa "display:none" oder "visibility:hidden".
  • Die Links zu Ihren Artikeln müssen direkt zu Ihren Artikelseiten führen und nicht auf eine Zwischenseite mit JavaScript-Weiterleitung.
Fehler beim Extrahieren

Wir konnten den Artikel nicht von der Seite extrahieren. Fehler bei Extraktionen treten auf, wenn wir keinen gültigen Titel, keinen Textkorpus und keinen Zeitstempel für den Artikel finden können. Wir geben URLs mit diesem Fehler aus, um Sie darüber zu informieren, warum manche Artikel nicht auf Google News erscheinen.

Empfehlungen

  • Achten Sie darauf, dass Titel, Textkörper und Zeitstempel leicht gecrawlt werden können. Dazu sollten diese Elemente als Text und nicht zum Beispiel als Bild verfügbar sein. Derzeit dient dieser Fehler lediglich zur Information. Wir arbeiten intensiv an der Verbesserung unserer Extraktionsmethoden, damit dieser Fehler seltener auftritt.
  • Reichen Sie eine Google News-Sitemap ein.
Keine Sätze gefunden

Der von uns aus der HTML-Seite extrahierte Artikeltext enthält keine Sätze mit Satzzeichen oder keine zusammenhängenden Wörter. Dieser Fehler wurde generiert, um die Aufnahme eines möglicherweise fehlerhaften Textabschnitts zu vermeiden.

Empfehlungen

  • Wenn der Artikel keine mit Satzzeichen versehenen Sequenzen zusammenhängender Wörter enthält, können wir ihn nicht in Google News aufnehmen. Vergewissern Sie sich, dass der Text Ihrer Artikel aus Sätzen besteht und Sie innerhalb Ihrer Absätze nicht zu häufig die Tags <br> und <p> verwenden.
  • Vergewissern Sie sich, dass der vollständige Text Ihrer Artikel im Quellcode der Artikelseite enthalten und beispielsweise nicht in einer JavaScript-Datei eingebettet ist.
  • Die Links zu Ihren Artikeln müssen direkt zur Artikelseite und dürfen nicht mithilfe einer JavaScript-Weiterleitung zu einer Zwischenseite führen.
Off-Site-Weiterleitung

Der Bereich oder die Artikelseite leitet zu einer URL auf einer anderen Domain weiter.

Empfehlungen

  • Alle Bereichsseiten und Artikel müssen sich innerhalb der Domain der Website befinden, die bei Google News registriert ist.
  • Falls Sie keine Weiterleitungen zu anderen Websites verwenden, vergewissern Sie sich, dass Ihre Website nicht von Dritten geändert wurde. Weitere Informationen zu gehackten Websites
Seite zu groß

Die Länge des Bereichs oder der Artikelseite überschreitet den zulässigen Maximalwert.

Empfehlung

  • Die HTML-Quellseite kann bis zu 256 KB groß sein.
Titel nicht zulässig

Der von uns aus der HTML-Seite extrahierte Titel gehört vermutlich nicht zu einem Nachrichtenartikel.

Empfehlung

  • Dieses Problem lässt sich häufig lösen, indem Sie das <title>-Tag auf der HTML-Seite auf den Titel des Artikels setzen und den Titel an einer gut sichtbaren Stelle auf der HTML-Seite wiederholen, etwa in einem <h1>-Tag. Weitere Informationen zu Titeln
Titel nicht gefunden

Wir konnten keinen Titel für den Artikel aus der HTML-Seite extrahieren.

Empfehlungen

  • Beachten Sie unsere Empfehlungen zur Formatierung von Titeln.
  • Um sicherzustellen, dass Ihre Artikel auf Mobilgeräten richtig angezeigt werden können, sollten Sie auf eine Zahl, die manchmal einem Zugriffsschlüssel entspricht, am Anfang des Titelankertexts verzichten.
Fehler bei der Dekomprimierung

Googlebot-News hat festgestellt, dass die Seite komprimiert wurde, konnte sie jedoch nicht dekomprimieren. Dies kann auf einen schlechten Zustand des Netzwerks oder eine fehlerhafte Programmierung oder Konfiguration des Webservers zurückzuführen sein.

Empfehlung

  • Überprüfen Sie Ihr Netzwerk bzw. Ihren Webserver.
Nicht unterstützter Inhaltstyp

Die Seite weist einen HTTP-Inhaltstyp auf, der nicht von Google News unterstützt wird.

Empfehlung

  • Die Artikel müssen die Inhaltstypen "text/html", "text/plain" oder "application/xhtml+xml" enthalten.
War dieser Artikel hilfreich?