Doppelte URLs zusammenfassen

Kanonische Seite für ähnliche oder doppelte Seiten festlegen

Zusammenfassung

Wenn es eine einzelne Seite gibt, die über mehrere URLs aufgerufen werden kann, oder verschiedene Seiten mit ähnlichem Inhalt existieren, z. B. eine Seite mit einer mobilen Version und einer Desktopversion, sieht Google diese als doppelte Versionen derselben Seite an. Google wählt eine URL als kanonische Version aus und crawlt diese. Alle anderen URLs werden als doppelte URLs betrachtet und seltener gecrawlt. 

Wenn Sie Google nicht ausdrücklich mitteilen, welche URL kanonisch ist, trifft Google die Wahl für Sie oder betrachtet beide als gleichwertig, was zu unerwünschtem Verhalten führen kann, wie unten unter Warum sollte ich eine kanonische URL auswählen? erklärt.

Weitere Informationen
Wahrscheinlich erfahren Sie hier mehr über Kanonisierung, als Sie eigentlich wissen müssen. Sie können diesen Abschnitt deshalb ruhig überspringen. Für den Fall, dass Sie sich gerne in diese Dinge einlesen, stellen wir die Informationen jedoch trotzdem zur Verfügung.
Wenn der Googlebot eine Website indexiert, versucht er, die auf jeder Seite behandelten Themen zu ermitteln. Findet er mehrere Seiten zum gleichen Thema auf derselben Website, wählt er die Seite aus, die die umfangreichste und nützlichste zu sein scheint, und kennzeichnet sie als kanonisch. Die kanonische Seite wird am häufigsten gecrawlt, die Duplikate dagegen seltener, um einen Teil des Crawling-Budgets auf Ihrer Website zu sparen. Wenn Sie dem Googlebot also nicht die kanonische Seite mitteilen und entscheiden, dass eine andere Seite kanonisch ist, verschwenden Sie unter Umständen Zeit damit, eine Seite zu aktualisieren, die der Googlebot nicht oft indexiert bzw. selten in Suchergebnissen anzeigt.
Für Google sind die kanonischen Seiten der Maßstab für die Inhalte Ihrer Website, was die Bewertung von Inhalten und Qualität betrifft. Das Ergebnis der Google-Suche verweist normalerweise auf die kanonische Seite, es sei denn, eines der Duplikate passt deutlich besser zur Suchanfrage eines Nutzers. Zum Beispiel verweist das Suchergebnis den Nutzer wahrscheinlich auf die mobile Seite, wenn er ein Mobilgerät verwendet – auch wenn die Desktopseite als kanonisch gekennzeichnet ist.
Google wählt eine kanonische Seite anhand mehrerer Faktoren (bzw. Signale) aus, z. B. danach, ob die Seite über http oder https bereitgestellt wird, wie die bevorzugte Domain des Nutzers lautet, welche Qualität die Seite hat; ob die URL in einer Sitemap aufgeführt ist und ob es "rel=canonical"-Kennzeichnungen gibt. Sie können die Auswahl der kanonischen Seite durch Google nicht erzwingen, es ist aber möglich, die Auswahl zu beeinflussen, indem Sie eine oder mehrere der hier gezeigten Techniken nutzen.

 

Warum sollte ich ähnliche/doppelte Seiten haben?

Es gibt gute Gründe, weshalb Ihre Website verschiedene URLs haben kann, die auf dieselbe Seite verweisen, oder doppelte bzw. sehr ähnliche Seiten mit unterschiedlichen URLs existieren. Dies sind die häufigsten:

  • Um mehrere Gerätetypen zu unterstützen:
    https://ihrewebsite.bsp/nachrichten/randalierende-koalas
    https://m.ihrewebsite.bsp/nachrichten/randalierende-koalas
    https://amp.ihrewebsite.bsp/nachrichten/randalierende-koalas
    
  • Um dynamische URLs für Suchparameter oder Sitzungs-IDs zu ermöglichen:
    https://www.ihrewebsite.bsp/produkte?kategorie=kleider&farbe=gruen
    https://www.ihrewebsite.bsp/kleider/cocktail?gclid=ABCD
    https://www.ihrewebsite.bsp/kleider/gruen/grueneskleid.html
  • Wenn Ihr Blogsystem automatisch mehrere URLs speichert, sobald Sie denselben Beitrag unter mehreren Bereichen einordnen:
    https://blog.ihrewebsite.bsp/kleider/gruene-kleider-sind-super/
    https://blog.ihrewebsite.bsp/gruene-sachen/gruene-kleider-sind-super/
  • Wenn Ihr Server so konfiguriert ist, dass unter http/https-Varianten mit und ohne "www" die gleichen Inhalte angezeigt werden:
    http://ihrewebsite.bsp/gruene-kleider
    https://ihrewebsite.bsp/gruene-kleider
    http://www.ihrewebsite.bsp/gruene-kleider
    
  • Wenn Inhalte, die Sie in einem Blog zur Syndikation für andere Websites veröffentlichen, unter diesen Domains teilweise oder vollständig repliziert werden:
    https://news.example.com/gruene-kleider-für-jeden-tag-155672.html (syndizierter Beitrag) https://blog.example.com/kleider/gruene-kleider-sind-super/3245/ (ursprünglicher Beitrag)

Warum sollte ich eine kanonische URL auswählen?

Es gibt zahlreiche Gründe, weshalb Sie explizit eine kanonische Seite aus einer Reihe doppelter/ähnlicher Seiten auswählen sollten:

  • Um festzulegen, welche URL in den Suchergebnissen angezeigt werden soll. Möglicherweise bevorzugen Sie es, wenn die Nutzer Ihre Produktseite mit den grünen Kleidern über den Link https://www.ihrewebsite.bsp/kleider/gruen/grueneskleid.html aufrufen anstatt über https://ihrewebsite.bsp/kleider/cocktail?gclid=ABCD.
  • Um Linksignale für ähnliche oder doppelte Seiten zusammenzufassen. Es ist hilfreich für Suchmaschinen, wenn sie die verfügbaren Informationen zu den einzelnen URLs, etwa zugehörige Links, zu einer einzigen, bevorzugten URL konsolidieren können. Das heißt, Links von anderen Websites zu http://ihrewebsite.bsp/kleider/cocktail?gclid=ABCD werden mit Links zu https://www.ihrewebsite.bsp/kleider/gruen/grueneskleid.html zusammengefasst.
  • Um Messwerte für ein einzelnes Produkt oder Thema leichter erfassen zu können. Wenn verschiedene URLs vorhanden sind, ist es schwieriger, konsolidierte Messwerte für einen bestimmten Inhalt zu generieren.
  • Um syndizierte Inhalte zu verwalten. Wenn Sie Ihre Inhalte zur Veröffentlichung unter anderen Domains syndizieren, ist es sinnvoll, das Seitenranking so zu konsolidieren, dass es sich auf Ihre bevorzugte URL auswirkt.
  • Um Crawling-Zeit auf doppelten Seiten zu sparen. Sie möchten, dass der Googlebot das Optimale aus Ihrer Website herausholt. Insofern ist es besser, wenn er statt der Desktop- und Mobilversionen derselben Seiten neue (bzw. aktualisierte) Seiten auf Ihrer Website crawlt.

Welche URL stuft Google als kanonisch (bzw. als Duplikat) ein?

Mit dem URL-Prüftool können Sie herausfinden, welche Seite Google als kanonisch betrachtet. Hinweis: Selbst wenn Sie eine kanonische Seite ausdrücklich festlegen, wählt Google unter Umständen aus verschiedenen Gründen, z. B. aufgrund der Leistung oder des Inhalts, eine andere kanonische Seite aus.

Eine kanonische Seite angeben

Abhängig von Ihrer Nutzung gibt es verschiedene Möglichkeiten, eine von zwei doppelten Seiten als kanonisch anzugeben:

Methode Beschreibung
Allgemeine Richtlinien Folgen Sie diesen Richtlinien bei allen Kanonisierungsmethoden.
Bevorzugte Domain angeben

Hierbei verwenden Sie die Search Console, um URLs einer Domain gegenüber ihren Gegenstücken auf einer anderen Domain als kanonisch anzugeben. Zum Beispiel example.com anstatt www.example.com. Nutzen Sie dies nur, wenn Sie zwei ähnliche Websites haben, die sich nur in ihrer Subdomain unterscheiden. Wenden Sie diese Möglichkeit nicht für http- und https-Websites an.

Vorteile:

  • Sehr einfach einzurichten, zu verwalten und zu ändern
  • Nutzbar, wenn Sie zwei identische Websites auf verschiedenen Domains haben

Nachteile:

  • Funktioniert nur beim Domain-Detaillierungsgrad. Außerdem müssen die Seiten identische Pfade und Namen haben, um als Duplikate eingestuft zu werden.
  • Ermöglicht nur eine einzelne Seite-zu-Seite-Zuordnung für Seiten mit identischen Pfaden und Namen
<link>-Tag "rel=canonical"

Hier fügen Sie für alle doppelten Seiten ein <link>-Tag im Code hinzu, das auf die kanonische Seite verweist.

Vorteile:

  • Ermöglicht das Zuordnen einer unendlichen Anzahl doppelter Seiten

Nachteile:

  • Kann zu einer Vergrößerung der Seite führen
  • Kann das Zuordnen auf größeren Websites oder Websites erschweren, auf denen sich die URLs häufig ändern
  • Funktioniert nur bei HTML-Seiten, nicht bei Dateien wie PDFs. In solchen Fällen können Sie den HTTP-Header "rel=canonical" verwenden.
HTTP-Header "rel=canonical"

Hierbei versenden Sie in Ihrer Seitenantwort einen "rel=canonical"-Header.

Vorteile:

  • Vergrößert die Seite nicht
  • Ermöglicht das Zuordnen einer unendlichen Anzahl doppelter Seiten

Nachteile:

  • Kann das Zuordnen auf größeren Websites oder Websites erschweren, auf denen sich die URLs häufig ändern
Sitemap

Hier geben Sie Ihre kanonischen Seiten in einer Sitemap an.

Vorteile:

  • Einfache Umsetzung und Verwaltung, besonders auf großen Websites

Nachteile:

  • Der Googlebot muss trotzdem für alle kanonischen Seiten, die Sie in der Sitemap angeben, das zugehörige Duplikat bestimmen.
  • Es ist ein weniger starkes Signal für den Googlebot als bei der "rel=canonical"-Zuordnungstechnik.
301-Weiterleitung Sie verwenden 301-Weiterleitungen, um dem Googlebot zu signalisieren, dass die umgeleitete URL eine bessere Version als die gegebene URL ist. Nutzen Sie dies nur, wenn Sie eine doppelte Seite einstellen.
AMP-Variante Wenn eine Ihrer Varianten eine AMP-Seite ist, müssen Sie den AMP-Richtlinien folgen, um die kanonische Seite und die AMP-Variante anzugeben.

 

Alle Methoden sind empfehlenswert, jedoch ist keine unbedingt erforderlich. Wenn Sie keine kanonische URL angeben, versuchen wir, die am besten geeignete Version oder URL zu ermitteln.

Allgemeine Richtlinien

Folgen Sie bei allen Kanonisierungsmethoden diesen allgemeinen Richtlinien.

Allgemeine Richtlinien
  • Verwenden Sie für die Kanonisierung nicht die Datei robots.txt.
  • Nutzen Sie für die Kanonisierung nicht das Tool zum Entfernen von URLs, denn damit werden alle Versionen einer URL aus der Suche entfernt.
  • Geben Sie nicht verschiedene kanonische URLs für dieselbe Seite mithilfe der gleichen oder unterschiedlicher Kanonisierungstechniken an – zum Beispiel eine URL in einer Sitemap und eine andere URL für dieselbe Seite über rel="canonical".
  • Verwenden Sie nicht das noindex-Tag, um die Auswahl einer kanonischen Seite zu verhindern. Diese Anweisung dient dazu, die Seite aus dem Index ausschließen, nicht die Auswahl einer kanonischen Seite zu verwalten. 
  • Geben Sie eine kanonische Seite an, wenn Sie hreflang-Tags verwenden. Geben Sie eine solche Seite in derselben Sprache bzw. in der bestmöglichen Ersatzsprache an, wenn für dieselbe Sprache keine kanonische Seite existiert.

Für kanonische URLs HTTPS gegenüber HTTP bevorzugen

Google bevorzugt HTTPS-Seiten gegenüber gleichwertigen HTTP-Seiten als kanonische URLs, es sei denn, es gibt damit Probleme oder Konflikte zwischen den Signalen, z. B. folgende:

  • Die HTTPS-Seite besitzt ein ungültiges SSL-Zertifikat.
  • Die HTTPS-Seite enthält unsichere Abhängigkeiten (außer Bilder).
  • Die HTTPS-Seite leitet die Nutzer auf oder über eine HTTP-Seite weiter.
  • Die HTTPS-Seite verfügt über einen rel="canonical"-Link zur HTTP-Seite.

HTTPS-Seiten werden von unseren Systemen zwar standardmäßig gegenüber HTTP-Seiten bevorzugt, Sie können diese Vorgehensweise jedoch auch mithilfe einer der folgenden Maßnahmen gewährleisten:

  • Weiterleitungen von der HTTP- auf die HTTPS-Seite hinzufügen
  • Einen rel="canonical"-Link von der HTTP-Seite zur HTTPS-Seite hinzufügen
  • HSTS implementieren

Um zu verhindern, dass Google fälschlicherweise die HTTP-Seite als kanonische URL verwendet, sollten Sie Folgendes vermeiden:

  • Ungültige SSL-Zertifikate und Weiterleitungen von HTTPS zu HTTP führen dazu, dass HTTP von unseren Systemen stark bevorzugt wird. Dies kann selbst durch die Implementierung von HSTS nicht umgangen werden.
  • Einbinden der HTTP-Seite in Ihre Sitemap oder Verwenden von hreflang-Einträgen anstelle der HTTPS-Version.
  • Implementieren Ihres SSL/TLS-Zertifikats für die falsche Hostvariante, z. B. Verwendung von example.com für die Auslieferung des Zertifikats für www.example.com.  Das Zertifikat muss mit der vollständigen Website-URL übereinstimmen oder ein Platzhalterzertifikat sein, das für mehrere Subdomains einer Domain verwendet werden kann.

Google anweisen, dynamische Parameter zu ignorieren

Durch Angaben zur Parameterbehandlung können Sie den Googlebot über Parameter informieren, die beim Crawling ignoriert werden sollen. Durch Ignorieren bestimmter Parameter können duplizierte Inhalte im Google-Index vermieden und Ihre Seite kann besser gecrawlt werden. Wenn Sie zum Beispiel angeben, dass der Parameter sessionid ignoriert werden soll, betrachtet der Googlebot die folgenden beiden URLs als Duplikate:

  • https://www.ihrewebsite.bsp/kleider/gruen.php?sessionid=273749
  • https://www.ihrewebsite.bsp/kleider/gruen.php

Spezielle Methoden

Wählen Sie eine der folgenden Methoden aus, um eine kanonische URL für doppelte URLs bzw. doppelte/ähnliche Seiten anzugeben.

Folgen Sie bei allen Methoden den allgemeinen Richtlinien weiter oben.

Eine bevorzugte Domain angeben

Nutzen Sie Search Console, um Google gegenüber anzugeben, welche Version Ihrer Website-URL Sie als kanonisch für Ihre Domain bevorzugen:

  • https://www.ihrewebsite.bsp
  • https://ihrewebsite.bsp

Wenn Sie https://ihrewebsite.bsp als Ihre bevorzugte Domain angeben, behandelt Google ähnliche URLs oder Seiten auf www.ihrewebsite.bsp wie Duplikate von Seiten auf ihrewebsite.bsp.

Weitere Informationen finden Sie im Artikel Bevorzugte Domain festlegen.

Link-Tag rel="canonical" verwenden

Sie können ein -Tag im Seitenkopf verwenden, um anzugeben, wann eine Seite ein Duplikat einer anderen Seite ist.

Angenommen, Sie möchten https://ihrewebsite.bsp/kleider/gruene-kleider/ als Ihre kanonische URL verwenden, derselbe Inhalt kann jedoch auch über mehrere andere URLs abgerufen werden. Geben Sie diese URL durch die folgenden Schritte als kanonisch an:

  1. Kennzeichnen Sie alle doppelten Seiten mit dem Link-Element rel="canonical". Fügen Sie dem <head>-Abschnitt doppelter Seiten ein <link>-Element mit dem Attribut rel="canonical" hinzu, das auf die kanonische Seite verweist, zum Beispiel so:
    <link rel="canonical" href="https://example.com/kleider/gruene-kleider" />

  2. Wenn es eine mobile Variante der kanonischen Seite gibt, fügen Sie ihr einen rel="alternate"-Link hinzu, der auf die mobile Version der Seite verweist:
    <link rel="alternate" media="only screen and (max-width: 640px)"  href="http://m.example.com/kleider/gruene-kleider">

  3. Fügen Sie alle hreflang-Tags oder andere Weiterleitungen hinzu, die für die Seite geeignet sind.

Geben Sie beim Link-Element rel="canonical" absolute statt relative Pfade an.

Verwenden Sie die Struktur https://www.ihrewebsite.bsp/kleider/gruen/grueneskleid.html
und nicht die Struktur /kleider/gruen/grueneskleid.html.
Verwenden Sie den HTTP-Header rel = "canonical".

Falls Sie Ihren Server konfigurieren können, haben Sie die Möglichkeit, mithilfe des HTTP-Headers rel="canonical" (statt mit HTML-Tags) die kanonische URL für Nicht-HTML-Dokumente wie PDF-Dateien anzugeben.

Wenn Sie beispielsweise eine PDF-Datei über mehrere URLs zugänglich machen, können Sie einen rel="canonical"-HTTP-Header für die doppelten URLs ausgeben, um dem Googlebot mitzuteilen, welche die kanonische URL für die PDF-Datei ist. Zum Beispiel so:

Link: <http://www.ihrewebsite.bsp/downloads/whitepaper.pdf>; rel="canonical"

Google unterstützt diese Methode derzeit nur für Websuchergebnisse.

Geben Sie beim Link-Element rel="canonical" absolute statt relative Pfade an. Das heißt:
Verwenden Sie die Struktur http://www.ihrewebsite.bsp/downloads/whitepaper.pdf
und nicht die Struktur /downloads/whitepaper.pdf.
Verwenden Sie eine Sitemap.

Wählen Sie eine kanonische URL für jede Ihrer Seiten aus und reichen Sie sie in einer Sitemap ein. Alle Seiten, die in einer Sitemap aufgeführt sind, werden als kanonisch vorgeschlagen. Der Googlebot entscheidet dann abhängig von der Ähnlichkeit der Inhalte, welche Seiten (gegebenenfalls) Duplikate sind.

Wir garantieren nicht, dass wir die Sitemap-URLs als kanonisch einstufen, aber sie erleichtern die Festlegung kanonischer Seiten für eine große Website. Außerdem sind Sitemaps nützlich, um Google mitzuteilen, welche Seiten Ihrer Website am wichtigsten sind.

Fügen Sie einer Sitemap keine Seiten hinzu, die nicht kanonisch sind. Wenn Sie eine Sitemap verwenden, geben Sie darin nur kanonische URLs an.

301-Weiterleitungen für deaktivierte URLs verwenden

Nutzen Sie diese Methode, wenn Sie vorhandene doppelte Seiten entfernen möchten, aber einen reibungslosen Übergang garantieren müssen, bevor Sie die alten URLs deaktivieren.

Angenommen, Ihre Seite kann über folgende URLs erreicht werden:

  • https://ihrewebsite.bsp/startseite
  • https://startseite.ihrewebsite.bsp
  • https://www.ihrewebsite.bsp

Wählen Sie eine dieser URLs als kanonische URL aus und verwenden Sie 301-Weiterleitungen, um Zugriffe von den anderen URLs an Ihre bevorzugte URL umzuleiten. Mit serverseitigen 301-Weiterleitungen lässt sich am besten garantieren, dass Nutzer und Suchmaschinen auf die richtige Seite gelenkt werden. Der 301-Statuscode besagt, dass eine Seite dauerhaft an einen neuen Speicherort verschoben wurde.

Wenn Sie einen Website-Hostingdienst nutzen, suchen Sie nach der entsprechenden Dokumentation für die Einrichtung von 301-Weiterleitungen.

War dieser Artikel hilfreich?
Wie können wir die Seite verbessern?