Duplizierter Content

"Duplizierter Content" sind im Allgemeinen umfangreiche Contentblöcke, die anderem Content auf derselben oder einer anderen Domain entsprechen oder auffällig ähneln. Im Allgemeinen besteht dabei keine Täuschungsabsicht. Zu nicht böswillig dupliziertem Content gehören beispielsweise:

  • Diskussionsforen, die sowohl reguläre als auch gekürzte, auf mobile Endgeräte ausgerichtete Seiten erzeugen
  • Lagerartikel, die über mehrere eindeutige URLs angezeigt bzw. referenziert werden
  • Druckversionen von Webseiten

Wenn Ihre Website mehrere Seiten mit weitgehend identischem Inhalt enthält, gibt es verschiedene Möglichkeiten, wie Sie Google Ihre bevorzugte URL mitteilen können. Dies wird als "Kanonisierung" bezeichnet. Weitere Informationen über die Kanonisierung

Gelegentlich wird Content jedoch bewusst auf verschiedenen Domains dupliziert mit der Absicht, das Ranking bei Suchmaschinen zu beeinflussen oder mehr Zugriffe auf sich zu ziehen. Derart unfaire Verhaltensweisen können zu einer negativen Nutzererfahrung führen, da den Besuchern im Grunde derselbe Content in einer Reihe von Suchergebnissen angezeigt wird.

Google ist sehr darum bemüht, Seiten mit unterschiedlichen Informationen zu indizieren und anzuzeigen. Die entsprechende Filterung bewirkt beispielsweise, dass bei einer Website mit jeweils einer "normalen" Version und einer "druckbaren" Version der einzelnen Artikel nur eine der beiden Versionen ausgewählt und angezeigt wird (es sei denn, eine der beiden Versionen wird durch einen "noindex" Meta-Tag blockiert). In den seltenen Fällen, in denen wir annehmen müssen, dass duplizierter Content mit der Absicht angezeigt wird, das Ranking zu manipulieren oder unsere Nutzer zu täuschen, nehmen wir die entsprechenden Korrekturen am Index und Ranking der betreffenden Websites vor. Infolgedessen werden diese Websites unter Umständen in den Suchergebnissen niedriger eingestuft oder sogar aus dem Google-Index entfernt und damit nicht mehr in den Suchergebnissen angezeigt.

Sie können aktiv dazu beitragen, duplizierten Content zu vermeiden und sicherzustellen, dass Besucher den Content sehen, den sie sehen sollen.

  • Verwenden Sie 301-Weiterleitungen: Falls Sie Ihre Website neu strukturiert haben, können Sie Ihre Nutzer, den Googlebot und andere Spider über 301-Weiterleitungen ("RedirectPermanent") in der HTACCESS-Datei intelligent weiterleiten. Bei Apache nehmen Sie diese Weiterleitung über eine ".htaccess"-Datei vor, bei IIS über die Verwaltungskonsole.

  • Achten Sie auf Konsistenz: Verwenden Sie immer dieselben internen Links. Vermeiden Sie beispielsweise die gleichzeitige Verwendung von Linkvariationen wie http://www.ihrebeispielurl.de/seite/, http://www.ihrebeispielurl.de/seite und http://www.ihrebeispielurl.de/seite/index.htm.

  • Verwenden Sie Domains auf oberster Ebene: Damit wir die richtige Version eines Dokuments bereitstellen können, sollten Sie vorzugsweise Domains der obersten Ebene verwenden, um landesspezifischen Content zu präsentieren. Die Website www.ihrebeispielurl.de weist eher auf landesspezifischen Content für Deutschland hin als www.ihrebeispielurl.com/de oder de.ihrebeispielurl.com.

  • Syndizieren Sie sorgfältig: Wenn Sie Ihren Content auf anderen Websites syndizieren, wird bei Google immer die Version angezeigt, die wir bei der jeweiligen Suche für die passendste halten. Dies ist jedoch möglicherweise nicht die von Ihnen bevorzugte Variante. Daher sollten Sie sicherstellen, dass jede Website, auf der Ihr Content syndiziert wird, einen Link zurück zum ursprünglichen Artikel enthält. Sie können auch die Betreiber der Websites, die Ihr Material verwenden, bitten, mit dem noindex-Meta-Tag das Indexieren ihrer Version des Contents durch Suchmaschinen zu unterbinden.

  • Nutzen Sie Search Console, um uns Ihre Wünsche zur Indizierung Ihrer Website mitzuteilen: Sie können Google die von Ihnen bevorzugte Domain angeben (beispielsweise http://www.ihrebeispielurl.de oder http://ihrebeispielurl.de).

  • Minimieren Sie wiederkehrende Textbausteine: Anstatt am Ende jeder Seite umfangreiche Urheberrechtshinweise einzufügen, können Sie lediglich eine kurze Zusammenfassung mit einem Link zu detaillierten Informationen aufführen. Darüber hinaus können Sie mit dem Tool "Parameterbehandlung" festlegen, wie Google URL-Parameter behandeln soll.

  • Vermeiden Sie die Veröffentlichung von Platzhaltern: Nutzer mögen keine "leeren" Seiten. Vermeiden Sie daher solche Seiten. Veröffentlichen Sie beispielsweise keine Seiten, für die Sie noch keinen richtigen Content haben. Falls Sie Platzhalterseiten erstellen, blockieren Sie die Indexierung dieser Seiten mithilfe des Meta-Tags "noindex".

  • Analysieren Sie Ihr Content Management-System: Überprüfen Sie, wie Content auf Ihrer Website angezeigt wird. Blogs, Foren und andere ähnliche Systeme zeigen denselben Content häufig in verschiedenen Formaten an. Ein Blog-Eintrag kann beispielsweise auf der Startseite eines Blogs, auf einer archivierten Seite oder auf einer Seite mit anderen Einträgen mit demselben Label erscheinen.

  • Minimieren Sie ähnlichen Content: Falls Sie über sehr ähnliche Seiten verfügen, sollten Sie entweder die einzelnen Seiten ausbauen oder alle Seiten in einer Seite zusammenfassen. Wenn Sie beispielsweise bei einer Reisewebsite zwei Seiten für zwei Städte mit denselben Informationen haben, können Sie diese Seiten entweder zu einer Seite für beide Städte kombinieren oder den einzelnen Seiten weitere spezifische Informationen über die einzelnen Städte hinzufügen.

Das Blockieren des Crawler-Zugriffs auf duplizierte Inhalte auf Ihrer Website durch eine robots.txt-Datei oder sonstige Methoden wird nicht mehr empfohlen. Wenn Suchmaschinen Seiten mit dupliziertem Content nicht crawlen können, können sie nicht automatisch erkennen, dass diese URLs auf denselben Content verweisen, und müssen sie als separate Seiten behandeln. Besser ist es, Suchmaschinen das Crawlen der betreffenden URLs zu gestatten, diese jedoch über das Link-Element rel="canonical", das URL-Parameter-Tool oder 301-Weiterleitungen als dupliziert zu kennzeichnen. Sollte duplizierter Content dazu führen, dass Google einen zu großen Teil Ihrer Website crawlt, können Sie zusätzlich in Search Console die Einstellungen "Crawling-Frequenz" anpassen.

Duplizierter Content auf einer Website ist kein Grund für Maßnahmen gegen diese Website, außer es scheint, dass mit diesem duplizierten Content Nutzer getäuscht bzw. Suchmaschinenergebnisse manipuliert werden sollen. Falls Ihre Website duplizierten Content enthält und Sie nicht den oben beschriebenen Tipps folgen, tun wir unser Bestes, eine Version des Contents in unseren Suchergebnissen anzuzeigen.

Falls jedoch unsere Nachforschungen ergaben, dass ein Täuschungsversuch vorliegt und Ihre Website aus unseren Suchergebnissen entfernt wurde, sollten Sie Ihre Website sorgfältig überprüfen. Falls Ihre Website aus unseren Suchergebnissen entfernt wurde, erhalten Sie in unseren Richtlinien für Webmaster ausführlichere Informationen zu diesem Thema. Sobald Sie Ihre Website überarbeitet und somit sichergestellt haben, dass sie unseren Richtlinien entspricht, senden Sie uns bitte einen Antrag auf erneute Überprüfung Ihrer Website.

In Ausnahmefällen wählt der Algorithmus die URL einer externen Website aus, auf der Ihre Inhalte ohne Ihre Zustimmung gehostet werden. Wenn Sie glauben, dass eine andere Website Ihre Inhalte übernommen hat und damit gegen das Urheberrechtsgesetz verstößt, setzen Sie sich mit dem Host der Website in Verbindung und fordern Sie die Entfernung der Inhalte. Stellen Sie außerdem einen Antrag auf Entfernung der rechtsverletzenden Seite aus den Suchergebnissen in Google, indem Sie eine Benachrichtigung registrieren, die dem US-amerikanischen Urheberrechtsgesetz (Digital Millennium Copyright Act) entspricht.

War dieser Artikel hilfreich?