Doppelte URLs zusammenfassen

Kanonische Seite für ähnliche oder doppelte Seiten festlegen

Wenn es eine einzelne Seite gibt, die über mehrere URLs aufgerufen werden kann, oder wenn verschiedene Seiten mit ähnlichem Inhalt existieren, z. B. eine mobile Version und eine Desktopversion, sieht Google diese als doppelte Versionen derselben Seite an. Google wählt eine URL als kanonische Version aus und crawlt diese. Alle anderen URLs werden als doppelte URLs betrachtet und seltener gecrawlt. 

Wenn Sie Google nicht ausdrücklich mitteilen, welche URL kanonisch ist, trifft Google die Wahl für Sie oder betrachtet beide als gleichwertig, was zu unerwünschtem Verhalten führen kann, wie unten unter Warum sollte ich eine kanonische URL auswählen? erklärt wird.

Was ist eine kanonische URL?
Eine kanonische URL ist die URL der Seite, von der Google annimmt, dass sie die repräsentativste aus einer Reihe doppelter Seiten auf Ihrer Website ist. Wenn Sie beispielsweise mehrere URLs für eine Seite haben, "example.com?kleid=1234" und "example.com/kleider/1234", wählt Google eine davon als kanonische URL aus. Beachten Sie, dass die Seiten nicht absolut identisch sein müssen. Kleinere Änderungen an Listen, z. B. eine Sortierung nach Preis oder eine Filterung nach Artikelfarbe, führen nicht dazu, dass die Seite als eigenständige, separate Seite betrachtet wird.
Die kanonische Seite kann sich in einer anderen Domain befinden als das Duplikat.
Weitere Informationen
Wenn der Googlebot eine Website indexiert, versucht er, auf den einzelnen Seiten die Hauptinhalte zu ermitteln. Findet er mehrere, dem Anschein nach identische Seiten auf derselben Website, wählt er die Seite aus, die die umfangreichste und nützlichste zu sein scheint, und kennzeichnet sie als kanonisch. Die kanonische Seite wird am häufigsten gecrawlt, die Duplikate dagegen seltener, um die Crawling-Last auf Ihrer Website zu reduzieren.
Google wählt eine kanonische Seite anhand mehrerer Faktoren (bzw. Signale) aus, z. B. danach, ob die Seite über http oder https bereitgestellt wird, wie die vom Nutzer erklärtermaßen bevorzugte Domain lautet, welche Qualität die Seite hat; ob die URL in einer Sitemap aufgeführt ist und ob es "rel=canonical"-Kennzeichnungen gibt. Mithilfe dieser Signale können Sie auf Ihre bevorzugte Seite hinweisen. Unter Umständen trifft Google jedoch aus verschiedenen Gründen eine andere Wahl als Sie selbst.
Verschiedene Sprachversionen einer einzelnen Seite gelten nur dann als Duplikate, wenn der Hauptinhalt in derselben Sprache verfasst ist. Wenn zum Beispiel nur die Kopf- und Fußzeile sowie andere nicht kritische Textabschnitte übersetzt wurden, der Haupttext jedoch identisch ist, gelten die Seiten als Duplikate.
Google verwendet die kanonischen Seiten als Hauptquellen zur Beurteilung von Inhalten und Qualität. Das Ergebnis der Google-Suche verweist normalerweise auf die kanonische Seite, es sei denn, eines der Duplikate passt deutlich besser zur Suchanfrage eines Nutzers. Zum Beispiel verweist das Suchergebnis den Nutzer wahrscheinlich auf die mobile Seite, wenn er ein Mobilgerät verwendet – auch wenn die Desktopseite als kanonisch gekennzeichnet ist.

Warum sollte ich ähnliche/doppelte Seiten haben?

Es gibt gute Gründe, weshalb Ihre Website verschiedene URLs haben kann, die auf dieselbe Seite verweisen, oder doppelte bzw. sehr ähnliche Seiten mit unterschiedlichen URLs existieren. Dies sind die häufigsten:

  • Um mehrere Gerätetypen zu unterstützen:
    https://example.com/nachrichten/randalierende-koalas
    https://m.example.com.bsp/nachrichten/randalierende-koalas
    https://amp.example.com.bsp/nachrichten/randalierende-koalas
    
  • Um dynamische URLs für Suchparameter oder Sitzungs-IDs zu ermöglichen:
    https://www.example.com.bsp/produkte?kategorie=kleider&farbe=gruen
    https://www.example.com/kleider/cocktail?gclid=ABCD
    https://www.example.com/kleider/gruen/grueneskleid.html
  • Wenn Ihr Blogsystem automatisch mehrere URLs speichert, sobald Sie denselben Beitrag unter mehreren Bereichen einordnen:
    https://blog.example.com/kleider/gruene-kleider-sind-super/
    https://blog.example.com/gruene-sachen/gruene-kleider-sind-super/
  • Wenn Ihr Server so konfiguriert ist, dass unter http/https-Varianten mit und ohne "www" die gleichen Inhalte angezeigt werden:
    http://example.com/gruene-kleider
    https://example.com/gruene-kleider
    http://www.example.com/gruene-kleider
    
  • Wenn Inhalte, die Sie in einem Blog zur Syndikation für andere Websites veröffentlichen, unter diesen Domains teilweise oder vollständig repliziert werden:
    https://news.example.com/gruene-kleider-für-jeden-tag-155672.html (syndizierter Beitrag) https://blog.example.com/kleider/gruene-kleider-sind-super/3245/ (ursprünglicher Beitrag)

Warum sollte ich eine kanonische URL auswählen?

Es gibt zahlreiche Gründe, weshalb Sie explizit eine kanonische Seite aus mehreren doppelten/ähnlichen Seiten auswählen sollten:

  • Um festzulegen, welche URL in den Suchergebnissen angezeigt werden soll. Möglicherweise bevorzugen Sie es, wenn die Nutzer Ihre Produktseite mit den grünen Kleidern über den Link https://www.example.com/kleider/gruen/grueneskleid.html aufrufen anstatt über https://example.com/kleider/cocktail?gclid=ABCD.
  • Um Linksignale für ähnliche oder doppelte Seiten zusammenzufassen. Es ist hilfreich für Suchmaschinen, wenn sie die verfügbaren Informationen zu den einzelnen URLs, etwa zugehörige Links, zu einer einzigen, bevorzugten URL konsolidieren können. Das heißt, Links von anderen Websites zu http://example.com/kleider/cocktail?gclid=ABCD werden mit Links zu https://www.example.com/kleider/gruen/grueneskleid.html zusammengefasst.
  • Um Messwerte für ein einzelnes Produkt oder Thema leichter erfassen zu können. Wenn mehrere URLs vorhanden sind, ist es schwieriger, konsolidierte Messwerte für einen bestimmten Inhalt zu generieren.
  • Um syndizierte Inhalte zu verwalten. Wenn Sie Ihre Inhalte zur Veröffentlichung unter anderen Domains syndizieren, ist es sinnvoll, das Seitenranking so zu konsolidieren, dass damit Ihre bevorzugte URL bewertet wird.
  • Um Crawling-Zeit auf doppelten Seiten zu sparen. Sie möchten, dass der Googlebot das Optimale aus Ihrer Website herausholt. Insofern ist es besser, wenn er statt der Desktop- und der Mobilversion derselben Seiten neue (oder aktualisierte) Seiten auf Ihrer Website crawlt.

Welche URL ist laut Google meine kanonische?

Mit dem URL-Prüftool können Sie herausfinden, welche Seite Google als kanonisch betrachtet. Hinweis: Selbst wenn Sie eine kanonische Seite ausdrücklich festlegen, wählt Google unter Umständen aus verschiedenen Gründen, z. B. aufgrund der Leistung oder des Inhalts, eine andere kanonische Seite aus.

Fehlerbehebung

Wenn sich eine kanonische URL in einer Property befindet, die Sie nicht besitzen, können Sie keinen Traffic für Ihre doppelte Seite sehen. Wenn Sie glauben, dass dies der Fall ist, gibt es einige häufige Ursachen dafür:
  • Falsch markierte Sprachvarianten: Wenn Sie mehrere Websites haben, auf denen weitgehend derselbe Content für unterschiedliche Nutzer in aller Welt bereitgestellt wird, finden Sie Hinweise zur Fehlerbehebung in unseren Richtlinien für lokalisierte Websites.
  • Falsche kanonische Tags: Einige Content-Management-Systeme (CMS) oder CMS-Plug-ins wenden möglicherweise die Techniken zur Kanonisierung, mit denen auf URLs externer Websites verwiesen wird, nicht richtig an. Überprüfen Sie, ob dies auf Ihren Content zutrifft. Wenn Ihre Website eine unerwartete kanonische URL-Einstellung anzeigt, die eventuell durch die falsche Verwendung von rel="canonical" oder einer 301-Weiterleitung entstanden ist, beheben Sie dieses Problem direkt.
  • Falsch konfigurierte Server: Manche Hosting-Fehlkonfigurationen können zu einer unerwarteten domainübergreifenden URL-Auswahl führen. Beispiele:
    • Ein Server ist möglicherweise falsch konfiguriert und gibt Inhalte aus a.com zurück, obwohl die Anfrage für eine URL auf b.com gesendet wurde.
    • Zwei nicht in Zusammenhang stehende Webserver geben möglicherweise identische Soft-404-Fehlerseiten aus, die Google nicht als Fehlerseiten erkennt.
  • Hacking: Bei manchen Angriffen auf Websites wird Code eingeschleust, der eine HTTP-301-Weiterleitung zurückgibt oder ein domainübergreifendes rel="canonical"-Link-Element in den HTML-Abschnitt <head> oder in einen HTTP-Header einfügt. Dieser Code verweist typischerweise auf eine URL, unter der schädliche Inhalte oder Spam gehostet werden. In diesem Fall wird von unseren Algorithmen möglicherweise die schädliche URL bzw. die Spam-URL statt der URL auf der manipulierten Website ausgewählt.
  • Eine gehackte Website: In seltenen Fällen kann es passieren, dass unser Algorithmus eine URL von einer externen Website auswählt, auf der Ihr Content ohne Ihre Erlaubnis gehostet wird. Wenn Sie denken, dass eine andere Website Ihre Inhalte kopiert und dabei gegen das Urheberrechtsgesetz verstößt, können Sie vom Host der Website verlangen, dass Ihre Inhalte entfernt werden. Außerdem können Sie beantragen, dass Google die Seite mit rechtswidrig verwendetem Content aus den Suchergebnissen entfernt. Füllen Sie dazu einen Antrag gemäß dem US-amerikanischen Urheberrechtsgesetz (Digital Millennium Copyright Act) aus.

Eine kanonische Seite angeben

Je nachdem, welche Methode Sie nutzen wollen, gibt es verschiedene Möglichkeiten, eine von mehreren doppelten Seiten als kanonisch anzugeben:

Methode Beschreibung
Allgemeine Richtlinien Diese Richtlinien sollten Sie bei allen Kanonisierungsmethoden beachten.
Bevorzugte Domain angeben

Hierbei verwenden Sie die Search Console, um URLs einer Domain gegenüber den entsprechenden URLs auf einer anderen Domain als kanonisch anzugeben. Beispiel: example.com statt www.example.com. Nutzen Sie dies nur, wenn Sie zwei ähnliche Websites haben, die sich nur in ihrer Subdomain unterscheiden. Wenden Sie diese Möglichkeit nicht bei http- und https-Websites an.

Vorteile:

  • Sehr einfach einzurichten, zu verwalten und zu ändern
  • Nutzbar, wenn Sie zwei identische Websites auf verschiedenen Domains haben

Nachteile:

  • Funktioniert nur auf der Ebene der Domain. Außerdem müssen die Seiten identische Pfade und Namen haben, um als Duplikate eingestuft zu werden.
  • Ermöglicht nur jeweils einzelne Seite-zu-Seite-Zuordnungen bei Seiten mit identischen Pfaden und Namen.
<link>-Tag "rel=canonical"

Hier fügen Sie für alle doppelten Seiten ein <link>-Tag im Code hinzu, das auf die kanonische Seite verweist.

Vorteile:

  • Ermöglicht das Zuordnen einer unendlichen Anzahl doppelter Seiten

Nachteile:

  • Kann zu einer Vergrößerung des Seitenumfangs führen
  • Kann das Zuordnen auf größeren Websites oder Websites erschweren, auf denen sich die URLs häufig ändern
  • Funktioniert nur bei HTML-Seiten, nicht bei Dateien wie PDFs. In solchen Fällen können Sie den HTTP-Header "rel=canonical" verwenden.
HTTP-Header "rel=canonical"

Hierbei versenden Sie in Ihrer Seitenantwort einen "rel=canonical"-Header.

Vorteile:

  • Vergrößert die Seite nicht
  • Ermöglicht das Zuordnen einer unendlichen Anzahl doppelter Seiten

Nachteile:

  • Kann das Zuordnen auf größeren Websites oder Websites erschweren, auf denen sich die URLs häufig ändern
Sitemap

Hier geben Sie Ihre kanonischen Seiten in einer Sitemap an.

Vorteile:

  • Einfache Umsetzung und Verwaltung, besonders auf großen Websites

Nachteile:

  • Der Googlebot muss trotzdem für alle kanonischen Seiten, die Sie in der Sitemap angeben, das zugehörige Duplikat bestimmen.
  • Es ist ein weniger starkes Signal für den Googlebot als bei der "rel=canonical"-Zuordnungstechnik.
301-Weiterleitung Sie verwenden 301-Weiterleitungen, um dem Googlebot zu signalisieren, dass die umgeleitete URL eine bessere Version als die gegebene URL ist. Nutzen Sie dies nur, wenn Sie eine doppelte Seite außer Betrieb nehmen.
AMP-Variante Wenn eine Ihrer Varianten eine AMP-Seite ist, orientieren Sie sich beim Angeben der kanonischen Seite und der AMP-Variante an die AMP-Richtlinien.

 

Alle diese Methoden können in bestimmten Fällen empfohlen werden, keine ist jedoch unbedingt erforderlich. Wenn Sie keine kanonische URL angeben, versuchen wir, die am besten geeignete Version oder URL zu ermitteln.

Allgemeine Richtlinien

Beachten Sie bei allen Kanonisierungsmethoden die folgenden allgemeinen Richtlinien.

Allgemeine Richtlinien
  • Verwenden Sie für die Kanonisierung nicht die Datei robots.txt.
  • Verwenden Sie für die Kanonisierung nicht das Tool zum Entfernen von URLs, denn damit werden alle Versionen einer URL aus der Suche entfernt.
  • Geben Sie nicht verschiedene kanonische URLs für dieselbe Seite an. Dabei spielt es keine Rolle, ob Sie die gleiche oder unterschiedliche Kanonisierungstechniken anwenden – zum Beispiel eine URL in einer Sitemap und eine andere URL für dieselbe Seite über rel="canonical".
  • Verwenden Sie nicht das noindex-Tag, um die Auswahl einer kanonischen Seite zu verhindern. Diese Anweisung wird dazu verwendet, Seiten aus dem Index ausschließen, nicht die Auswahl einer kanonischen Seite zu verwalten. 
  • Geben Sie eine kanonische Seite an, wenn Sie hreflang-Tags verwenden. Geben Sie eine solche Seite in derselben Sprache bzw. in der bestmöglichen Ersatzsprache an, wenn für dieselbe Sprache keine kanonische Seite existiert.

  • Verlinken Sie bei Verknüpfungen innerhalb Ihrer Website die kanonische URL, keine doppelte. Durch eine einheitliche Verknüpfung der URL, die Sie als kanonische URL bestimmen, mit Ihrer Website kann Google Ihre Präferenzen besser erkennen.

HTTPS als Präferenz gegenüber HTTP bei kanonischen URLs

Google bevorzugt HTTPS-Seiten gegenüber gleichwertigen HTTP-Seiten als kanonische URLs, es sei denn, es gibt mit der HTTPS-Seite Probleme oder Konflikte zwischen den Signalen, z. B. folgende:

  • Die HTTPS-Seite besitzt ein ungültiges SSL-Zertifikat.
  • Die HTTPS-Seite enthält unsichere Abhängigkeiten (außer Bildern).
  • Die HTTPS-Seite leitet die Nutzer auf oder über eine HTTP-Seite weiter.
  • Die HTTPS-Seite verfügt über einen rel="canonical"-Link zur HTTP-Seite.

HTTPS-Seiten werden von unseren Systemen zwar standardmäßig gegenüber HTTP-Seiten bevorzugt, Sie können die Bevorzugung jedoch auch selbst sicherstellen, indem Sie

  • Weiterleitungen von der HTTP- auf die HTTPS-Seite hinzufügen
  • einen rel="canonical"-Link von der HTTP-Seite zur HTTPS-Seite hinzufügen
  • HSTS implementieren

Um zu verhindern, dass Google die HTTP-Seite fälschlich als kanonische URL verwendet, sollten Sie Folgendes vermeiden:

  • Ungültige SSL-Zertifikate und Weiterleitungen von HTTPS zu HTTP. Diese führen dazu, dass HTTP von unseren Systemen stark bevorzugt wird. Dies kann selbst durch die Implementierung von HSTS nicht umgangen werden.
  • Einbinden der HTTP-Seite in Ihre Sitemap oder Verwenden von hreflang-Einträgen anstelle der HTTPS-Version.
  • Implementieren Ihres SSL/TLS-Zertifikats für die falsche Hostvariante, z. B. Verwendung von example.com für die Auslieferung des Zertifikats für www.example.com.  Das Zertifikat muss mit der vollständigen Website-URL übereinstimmen oder ein Platzhalterzertifikat sein, das für mehrere Subdomains einer Domain verwendet werden kann.

Nur für fortgeschrittene Nutzer: Google anweisen, dynamische Parameter zu ignorieren

Durch Angaben zur Parameterbehandlung können Sie den Googlebot über solche Parameter informieren, die beim Crawling ignoriert werden sollen. Durch Ignorieren bestimmter Parameter können duplizierte Inhalte im Google-Index vermieden und Ihre Seite kann besser gecrawlt werden. Wenn Sie zum Beispiel angeben, dass der Parameter sessionid ignoriert werden soll, betrachtet der Googlebot die folgenden beiden URLs als Duplikate:

  • https://www.example.com/kleider/gruen.php?sessionid=273749
  • https://www.example.com/kleider/gruen.php

Spezielle Methoden

Wählen Sie eine der folgenden Methoden aus, um eine kanonische URL für doppelte URLs bzw. doppelte/ähnliche Seiten anzugeben.

Beachten Sie bei allen Methoden die allgemeinen Richtlinien weiter oben.

Eine bevorzugte Domain angeben

Nutzen Sie Search Console, um Google gegenüber anzugeben, welche Version Ihrer Website-URL Sie als kanonisch für Ihre Domain bevorzugen:

  • https://www.example.com
  • https://example.com

Wenn Sie https://example.com als Ihre bevorzugte Domain angeben, behandelt Google ähnliche URLs oder Seiten auf www.example.com wie Duplikate von Seiten auf example.com.

Weitere Informationen finden Sie im Artikel Bevorzugte Domain festlegen.

Link-Tag rel="canonical" verwenden

Sie können ein -Tag im Seitenkopf verwenden, um anzugeben, wann eine Seite ein Duplikat einer anderen Seite ist.

Angenommen, Sie möchten https://example.com/kleider/gruene-kleider/ als Ihre kanonische URL verwenden, derselbe Inhalt kann jedoch auch über mehrere andere URLs abgerufen werden. Geben Sie diese URL durch die folgenden Schritte als kanonisch an:

  1. Kennzeichnen Sie alle doppelten Seiten mit dem Link-Element rel="canonical". Fügen Sie dem <head>-Abschnitt doppelter Seiten ein <link>-Element mit dem Attribut rel="canonical" hinzu, das auf die kanonische Seite verweist, zum Beispiel so:
    <link rel="canonical" href="https://example.com/kleider/gruene-kleider"/>

  2. Wenn es eine mobile Variante der kanonischen Seite gibt, fügen Sie ihr einen rel="alternate"-Link hinzu, der auf die mobile Version der Seite verweist:
    <link rel="alternate" media="only screen and (max-width: 640px)"  href="http://m.example.com/kleider/gruene-kleider">

  3. Fügen Sie alle hreflang-Tags oder andere Weiterleitungen hinzu, die für die Seite geeignet sind.

Geben Sie beim Link-Element rel="canonical" absolute statt relative Pfade an.

Verwenden Sie die Struktur https://www.example.com/kleider/gruen/grueneskleid.html
und nicht die Struktur /kleider/gruen/grueneskleid.html.
Verwenden Sie den HTTP-Header rel = "canonical".

Falls Sie Ihren Server konfigurieren können, haben Sie die Möglichkeit, mithilfe von HTTP-Headern rel="canonical" (statt mit HTML-Tags) die kanonische URL auch für Nicht-HTML-Dokumente wie PDF-Dateien anzugeben.

Wenn Sie beispielsweise eine PDF-Datei über mehrere URLs zugänglich machen, können Sie einen rel="canonical"-HTTP-Header für die doppelten URLs ausgeben, um dem Googlebot mitzuteilen, welche die kanonische URL für die PDF-Datei ist. Zum Beispiel so:

Link: <http://www.example.com/downloads/whitepaper.pdf>; rel="canonical"

Google unterstützt diese Methode derzeit nur für Websuchergebnisse.

Geben Sie beim Link-Element rel="canonical" absolute statt relative Pfade an. Das heißt:
Verwenden Sie die Struktur http://www.example.com/downloads/whitepaper.pdf
und nicht die Struktur /downloads/whitepaper.pdf.
Verwenden Sie eine Sitemap.

Wählen Sie eine kanonische URL für jede Ihrer Seiten aus und reichen Sie sie in einer Sitemap ein. Alle Seiten, die in einer Sitemap aufgeführt sind, werden als kanonisch vorgeschlagen. Der Googlebot entscheidet dann abhängig von der Ähnlichkeit der Inhalte, welche Seiten (gegebenenfalls) Duplikate sind.

Wir garantieren nicht, dass wir die Sitemap-URLs als kanonisch einstufen, aber Sitemaps erleichtern die Festlegung kanonischer Seiten für eine große Website. Außerdem sind sie nützlich, um Google mitzuteilen, welche Seiten Ihrer Website am wichtigsten sind.

Fügen Sie einer Sitemap keine Seiten hinzu, die nicht kanonisch sind. Wenn Sie eine Sitemap verwenden, geben Sie darin nur kanonische URLs an.

301-Weiterleitungen für deaktivierte URLs verwenden

Nutzen Sie diese Methode, wenn Sie vorhandene doppelte Seiten entfernen möchten, aber einen reibungslosen Übergang garantieren müssen, bevor Sie die alten URLs deaktivieren.

Angenommen, Ihre Seite kann über folgende URLs erreicht werden:

  • https://example.com/startseite
  • https://startseite.example.com
  • https://www.example.com

Wählen Sie in diesem Fall eine dieser URLs als kanonische URL aus und verwenden Sie 301-Weiterleitungen, um Zugriffe von den anderen URLs an Ihre bevorzugte URL umzuleiten. Mit serverseitigen 301-Weiterleitungen lässt sich am besten garantieren, dass Nutzer und Suchmaschinen auf die richtige Seite gelenkt werden. Der 301-Statuscode besagt, dass eine Seite dauerhaft an einen neuen Speicherort verschoben wurde.

Wenn Sie einen Website-Hostingdienst nutzen, recherchieren Sie die entsprechende Dokumentation für die Einrichtung von 301-Weiterleitungen.

War dieser Artikel hilfreich?
Wie können wir die Seite verbessern?