Content duplizieren

"Duplizierter Content" sind umfangreiche Contentblöcke, die anderem Content auf derselben oder einer anderen Domain entsprechen oder auffällig ähneln. Im Allgemeinen besteht dabei keine Täuschungsabsicht. Zu nicht böswillig dupliziertem Content gehören beispielsweise:

  • Diskussionsforen, die sowohl reguläre als auch gekürzte, auf mobile Endgeräte ausgerichtete Seiten erzeugen
  • Lagerartikel, die über mehrere eindeutige URLs angezeigt bzw. referenziert werden
  • Druckversionen von Webseiten

Wenn Ihre Website mehrere Seiten mit weitgehend identischem Inhalt enthält, gibt es verschiedene Möglichkeiten, wie Sie Google Ihre bevorzugte URL mitteilen können. Dies wird als "Kanonisierung" bezeichnet. Weitere Informationen über die Kanonisierung

Gelegentlich wird Content jedoch bewusst auf verschiedenen Domains dupliziert mit der Absicht, das Ranking bei Suchmaschinen zu beeinflussen oder mehr Zugriffe auf sich zu ziehen. Derart unfaire Verhaltensweisen können zu einer negativen Nutzererfahrung führen, da den Besuchern im Grunde derselbe Content in einer Reihe von Suchergebnissen angezeigt wird.

Google ist sehr darum bemüht, Seiten mit unterschiedlichen Informationen zu indizieren und anzuzeigen. Falls Ihre Website beispielsweise eine "normale" und eine Druckversion jedes Artikels enthält und keine dieser Versionen durch ein noindex-Meta-Tag blockiert wird, bedeutet diese Filterung, dass wir eine von ihnen für die Auflistung auswählen. In den seltenen Fällen, in denen wir annehmen müssen, dass duplizierter Content mit der Absicht angezeigt wird, das Ranking zu manipulieren oder unsere Nutzer zu täuschen, nehmen wir die entsprechenden Korrekturen am Index und Ranking der betreffenden Websites vor. Infolgedessen werden diese Websites unter Umständen in den Suchergebnissen niedriger eingestuft oder sogar aus dem Google-Index entfernt und damit nicht mehr in den Suchergebnissen angezeigt.

Sie können aktiv dazu beitragen, duplizierten Content zu vermeiden und sicherzustellen, dass Besucher den Content sehen, den sie sehen sollen.

  • Verwenden Sie 301-Weiterleitungen: Falls Sie Ihre Website neu strukturiert haben, können Sie Ihre Nutzer, den Googlebot und andere Spider über 301-Weiterleitungen ("RedirectPermanent") in der HTACCESS-Datei geschickt weiterleiten. Bei Apache nehmen Sie diese Weiterleitung über eine ".htaccess"-Datei vor, bei IIS über die Verwaltungskonsole.

  • Achten Sie auf Konsistenz: Verwenden Sie immer dieselben internen Links. Vermeiden Sie beispielsweise die gleichzeitige Verwendung der folgenden Links: http://www.example.com/seite/, http://www.example.com/seite und http://www.example.com/seite/index.htm.

  • Verwenden Sie Domains auf oberster Ebene: Damit wir die richtige Version eines Dokuments bereitstellen können, sollten Sie vorzugsweise Domains der obersten Ebene verwenden, um landesspezifischen Content zu präsentieren. Die Website www.example.de weist eher auf Deutschland-spezifischen Content hin als www.example.com/de oder de.example.com.

  • Syndizieren Sie sorgfältig: Wenn Sie Ihren Content auf anderen Websites syndizieren, wird bei Google immer die Version angezeigt, die wir bei der jeweiligen Suche für die passendste halten. Dies ist jedoch möglicherweise nicht die von Ihnen bevorzugte Variante. Daher sollten Sie sicherstellen, dass jede Website, auf der Ihr Content syndiziert wird, einen Link zurück zum ursprünglichen Artikel enthält. Sie können auch die Betreiber der Websites, die Ihr Material verwenden, bitten, mit dem noindex-Meta-Tag das Indexieren ihrer Version des Contents durch Suchmaschinen zu unterbinden.

  • Teilen Sie uns über die Webmaster-Tools mit, wie Ihre Website indexiert werden soll: Sie können Google Ihre bevorzugte Domain nennen (zum Beispiel http://www.example.com oder http://example.com).

  • Minimieren Sie wiederkehrende Textbausteine: Anstatt am Ende jeder Seite umfangreiche Urheberrechtshinweise einzufügen, können Sie lediglich eine kurze Zusammenfassung mit einem Link zu detaillierten Informationen aufführen. Darüber hinaus können Sie mit dem Tool "Parameterbehandlung" festlegen, wie Google URL-Parameter behandeln soll.

  • Veröffentlichen Sie keine Stubs: Besucher mögen keine "leeren" Seiten, daher sollten möglichst keine Platzhalter verwendet werden. Veröffentlichen Sie beispielsweise keine Seiten, für die Sie noch keinen richtigen Content haben. Falls Sie Platzhalterseiten erstellen, blockieren Sie die Indexierung dieser Seiten mithilfe des Meta-Tags "noindex".

  • Analysieren Sie Ihr Content Management-System: Überprüfen Sie, wie Content auf Ihrer Website angezeigt wird. Blogs, Foren und andere ähnliche Systeme zeigen denselben Content häufig in verschiedenen Formaten an. Ein Blog-Eintrag kann beispielsweise auf der Startseite eines Blogs, auf einer archivierten Seite oder auf einer Seite mit anderen Einträgen mit demselben Label erscheinen.

  • Minimieren Sie ähnlichen Content: Falls Sie über sehr ähnliche Seiten verfügen, sollten Sie entweder die einzelnen Seiten ausbauen oder alle Seiten in einer Seite zusammenfassen. Wenn Sie beispielsweise bei einer Reisewebsite zwei Seiten für zwei Städte mit denselben Informationen haben, können Sie diese Seiten entweder zu einer Seite für beide Städte kombinieren oder den einzelnen Seiten weitere spezifische Informationen über die einzelnen Städte hinzufügen.

Das Blockieren des Crawler-Zugriffs auf duplizierte Inhalte auf Ihrer Website durch eine robots.txt-Datei oder sonstige Methoden wird nicht mehr empfohlen. Wenn Suchmaschinen Seiten mit dupliziertem Content nicht crawlen können, können sie nicht automatisch erkennen, dass diese URLs auf denselben Content verweisen, und müssen sie als separate Seiten behandeln. Es ist eine bessere Lösung, den Suchmaschinen das Crawlen dieser URLs zu gestatten, diese jedoch mit dem Linkelement rel="canonical", dem Tool zur URL-Parameterbehandlung oder 301-Weiterleitungen als Duplikate zu kennzeichnen. Kommt es aufgrund duplizierten Contents dazu, dass ein zu großer Teil Ihrer Website gecrawlt wird, können Sie in den Webmaster-Tools die Einstellung für die Crawling-Frequenz anpassen.

Duplizierter Content auf einer Website ist kein Grund für Maßnahmen gegen diese Website, außer es scheint, dass mit diesem duplizierten Content Nutzer getäuscht bzw. Suchmaschinenergebnisse manipuliert werden sollen. Falls Ihre Website duplizierten Content enthält und Sie nicht den oben beschriebenen Tipps folgen, tun wir unser Bestes, eine Version des Contents in unseren Suchergebnissen anzuzeigen.

Falls jedoch unsere Nachforschungen ergaben, dass ein Täuschungsversuch vorliegt und Ihre Website aus unseren Suchergebnissen entfernt wurde, sollten Sie Ihre Website sorgfältig überprüfen. Falls Ihre Website aus unseren Suchergebnissen entfernt wurde, erhalten Sie ausführlichere Informationen in unseren Richtlinien für Webmaster. Sobald Sie Ihre Website überarbeitet und sichergestellt haben, dass sie unseren Richtlinien entspricht, senden Sie uns bitte einen Antrag auf erneute Überprüfung Ihrer Website.

In Ausnahmefällen kann es vorkommen, dass von unseren Algorithmen eine URL von einer externen Website ausgewählt wird, die Ihren Content ohne Ihre Erlaubnis hostet. Wenn Sie der Ansicht sind, dass eine andere Website Ihren Content kopiert und dabei gegen das Urheberrecht verstößt, können Sie vom Host der Website verlangen, dass der Content entfernt wird. Außerdem können Sie beantragen, dass Google die Seiten mit rechtswidrig verwendetem Content aus den Suchergebnissen entfernt. Füllen Sie dazu einen Antrag gemäß dem US-amerikanischen Urheberrechtsgesetz (Digital Millennium Copyright Act) aus.