Crawling-Fehler

Fehler des Typs "Nicht gefunden" (404)

Was ist ein Fehler des Typs "Nicht gefunden"?

Google findet Webinhalte durch das Verfolgen von Links von einer Seite zur nächsten. Im Allgemeinen wird eine Fehlermeldung des Typs "Nicht gefunden" – gewöhnlich ein HTTP-Statuscode 404 – zurückgegeben, wenn die Seite, auf die der Googlebot zuzugreifen versucht, nicht existiert. Entweder wurde die Seite gelöscht oder umbenannt, ohne den Nutzer von der alten URL auf die neue Seite weiterzuleiten, oder der Link enthält einen Tippfehler.

Fehler des Typs "Nicht gefunden" beheben

Im Allgemeinen wirken sich 404-Fehler nicht auf das Ranking Ihrer Website in Google aus und Sie können sie ohne Probleme ignorieren. Die Ursache sind meist Tippfehler oder eine Fehlkonfiguration zum Beispiel bei Links, die automatisch von einem CMS (Content Management System) erstellt werden. Auch durch die verstärkten Bemühungen von Google, Links in eingebetteten Inhalten wie JavaScript zu erkennen und zu crawlen, kann es zu diesem Fehlertyp kommen.  Nachfolgend aufgeführt sind einige Untersuchungsansätze:

  • Im Abschnitt Über diese Seiten verlinkt können Sie sehen, woher die ungültigen Links stammen, indem Sie auf die URL klicken.
  • Korrigieren oder löschen Sie Links von Ihrer eigenen Website.
  • Erfassen Sie beabsichtigten Traffic von fehlerhaft geschriebenen Links auf anderen Websites mit 301-Weiterleitungen.
    Wenn eine legitime URL einen Fehler enthält, z. B. www.ihrebeispielurl.de/roteshue statt www.ihrebeispielurl.de/roteschuhe, liegt das meistens an einem Tippfehler, den jemand beim Erstellen des Links auf Ihre Website eingegeben hat. In diesem Fall können Sie die fehlerhafte URL in Ihrer Serverkonfiguration erfassen und eine 301-Weiterleitung zur korrekten URL erstellen. Sie können auch Kontakt mit dem Webmaster der Website mit einem fehlerhaften Link aufnehmen und darum bitten, dass der Link aktualisiert oder entfernt wird.

404-Meldungen erfüllen im Web eine sinnvolle Funktion und gehören in gewissem Umfang einfach dazu. Sie werden wahrscheinlich niemals jeden einzelnen Link auf Ihre Website unter Kontrolle haben oder jeden in der Search Console aufgeführten 404-Fehler beheben können. Versuchen Sie stattdessen einfach, die wichtigsten Probleme zu ermitteln und zu lösen.

Wann ein 404-Statuscode zurückgegeben werden sollte

Wenn Sie eine Seite von Ihrer Website entfernen, überlegen Sie sich, ob Sie die betreffenden Inhalte an eine andere Stelle verschieben oder gänzlich entfernen möchten. 

  • Wenn Sie Inhalte in eine neue URL verschieben, können Sie die alte URL zur neuen URL weiterleiten. Wenn Nutzer die alte URL besuchen, um nach diesen Inhalten zu suchen, werden Sie automatisch zur neuen URL weitergeleitet.
  • Wenn Sie Inhalte komplett löschen und sie nicht durch neue ersetzen möchten, können Sie festlegen, dass die alte URL einen 404- oder 410-Fehler zurückgibt. Zurzeit behandelt Google den Code 410 ("Entfernt") wie den Code 404 ("Nicht gefunden"). 

Das Zurückgeben eines anderen Codes als 404 oder 410 für eine nicht vorhandene Seite (oder das Weiterleiten von Nutzern auf eine andere Seite wie beispielsweise die Startseite anstelle des Zurückgebens eines 404-Codes) ist problematisch. Solche Seiten werden als Soft 404-Fehler bezeichnet und können für Nutzer und Suchmaschinen verwirrend sein.

Unerwartete 404-Fehler

Bei den Crawling-Fehlern werden gelegentlich 404-Fehler für URLs aufgeführt, die Ihrer Meinung nach nicht auf Ihrer eigenen Website oder im Web existieren. Diese unerwarteten URLs können eventuell vom Googlebot generiert werden, der versucht hat, Links zu folgen, die er in JavaScript, Flash-Dateien oder anderen eingebetteten Inhalten gefunden hat.

Beispielsweise könnte Ihre Website mithilfe des folgenden Codes Dateidownloads in Google Analytics verfolgen:

<a href="helloworld.pdf" onClick="_gaq.push(['_trackPageview','/download-helloworld']);">Hello World PDF</a>

In diesem Beispiel versucht der Googlebot, die URL http://www.ihrebeispielurl.de/download-helloworld zu crawlen, auch wenn es sich nicht um eine tatsächliche Seite handelt. In diesem Fall kann der Link in der Search Console-Funktion "Crawling-Fehler" als 404-Fehler ("Nicht gefunden") angezeigt werden.

Google arbeitet an einer entsprechenden Erkennung und Lösung, damit diese URLs nicht mehr unter "Crawling-Fehler" angezeigt werden. 

War dieser Artikel hilfreich?
Ja
Nein