Suche
Suche löschen
Suche schließen
Google-Apps
Hauptmenü

Zugriff auf Inhalte Ihrer Website blockieren

In diesem Artikel wird erläutert, wie Sie den Zugriff auf Inhalte Ihrer Website blockieren.

Einige der Inhalte, die Sie veröffentlichen, sind möglicherweise nicht für die Aufnahme in Google News geeignet. Sie können den Zugriff auf bestimmte Inhalte einschränken, indem Sie den Zugriff der Webcrawler von Google, Googlebot und Googlebot-News, blockieren.

Hier finden Sie weitere Informationen zur Personalisierung von Google News, etwa wie Sie mehr Artikel aus Ihren Lieblingsquellen anzeigen und unerwünschte Nachrichtenquellen blockieren können.

Robots.txt-Datei erstellen

Durch Verwendung einer robots.txt-Datei können Sie weitgehend selbst steuern, welche Teile Ihrer Website in der Google-Suche und in Google News erscheinen. Weitere Informationen zu robots.txt-Dateien 

Sie können den Zugriff folgendermaßen blockieren:

  • Wenn Sie nicht möchten, dass Ihre Website durch Google News indexiert wird, können Sie mithilfe einer robots.txt-Datei den Zugriff für Googlebot-News blockieren.
  • Wenn Sie nicht möchten, dass Ihre Website durch Google News und die Google-Suche indexiert wird, können Sie mithilfe einer robots.txt-Datei den Zugriff für den Googlebot blockieren.

Achten Sie darauf, dass unser Crawler Zugriff auf Ihre robots.txt-Datei hat. So wissen wir Bescheid, falls Sie bestimmte Bereiche Ihrer Website angegeben haben, die nicht gecrawlt werden sollen.

Meta-Tag erstellen

Sie können einer HTML-Seite auch ein Meta-Tag hinzufügen. Das Meta-Tag enthält Informationen zu Seiten, die nicht gecrawlt werden sollen. Weitere Informationen dazu, wie Sie die Aufnahme in den Suchindex mit Meta-Tags verhindern

Nachfolgend finden Sie einige gängige Meta-Tags, die Sie Ihren HTML-Seiten hinzufügen können:

  • Wenn Sie nicht möchten, dass bestimmte Artikel auf Ihrer Website durch Google News indexiert werden, können Sie den Zugriff für Googlebot-News mithilfe des folgenden Meta-Tags blockieren: <meta name="Googlebot-News" content="noindex, nofollow">.
  • Wenn Sie nicht möchten, dass bestimmte Artikel auf Ihrer Website durch Google News und die Google-Suche indexiert werden, können Sie den Zugriff für den Googlebot mithilfe des folgenden Meta-Tags blockieren: <meta name="googlebot" content="noindex, nofollow">.
  • Wenn Sie nicht möchten, dass bestimmte Artikel auf Ihrer Website durch jegliche Robots gecrawlt werden, verwenden Sie das folgende Meta-Tag: <meta name="robots" content="noindex, nofollow">.
  • Um zu verhindern, dass Bilder eines bestimmten Artikels durch Robots gecrawlt werden, verwenden Sie das folgende Meta-Tag: <meta name="robots" content="noimageindex">.
  • Wenn Sie uns informieren möchten, dass ein Artikel zu einem bestimmten Zeitpunkt aus dem Google-Index entfernt werden sollte, verwenden Sie folgendes Meta-Tag: 
    <meta name="googlebot" content="unavailable_after: 25-Aug-2011 15:00:00 EST">

    Geben Sie Datum und Uhrzeit im RFC-850-Format an. Dieses Meta-Tag wird wie ein Antrag auf Entfernen von Einträgen behandelt. Das heißt, die betreffende Seite wird ungefähr einen Tag nach Ablauf des angegebenen Datums aus den Suchergebnissen entfernt. Damit das Tag ordnungsgemäß funktioniert, muss es jedoch zu dem Zeitpunkt, zu dem Ihr Artikel das erste Mal gecrawlt wird, im Artikel enthalten sein.

HTTP-Header-Spezifikationen

Sie können Anweisungen für Robots auch im HTTP-Header angeben. Weitere Informationen zu HTTP-Header-Spezifikationen
 

Hinweis: Wenn Sie mehrere Robot-Optionen gewählt haben, folgt Google der restriktivsten Interpretation Ihrer Angaben.

War dieser Artikel hilfreich?
Wie können wir die Seite verbessern?