Der Canonical Tag einfach und verständlich erklärt

Seobility SEO Software

1. Was ist der Canonical Tag?

Der Canonical Tag wird eingesetzt, um Duplicate Content (übersetzt: doppelten Inhalt) korrekt auszuzeichnen. Wenn eine Suchmaschine Ihre Website crawlt also durchsucht und dort doppelten Inhalt findet, führt das dazu, das die Seite im Ranking heruntergesetzt wird.
Die Suchmaschine geht davon aus, das Sie absichtlich identischen Inhalt hinterlegt haben, um Ihre Seite im Ranking weiter nach oben zu bringen.
Sie vermeiden, das eine Suchmaschine Ihre Seiten mit Duplicate Content als versuchte Manipulation interpretieren, indem Sie die betroffenen Seiten mit einer kanonischen URL (Synonym für: Canonical Tag) auszeichnen.
Auf diese Weise teilen Sie einer Suchmaschine mit, welche die originale Webseite ist und das die Seiten mit identischem Inhalt keine absichtliche Manipulation sind sondern aus anderen Gründen existieren.

zurück zum Inhaltsverzeichnis

2. Wie entsteht Duplicate Content?

Duplicate Content kann natürlich absichtlich entstehen, indem man wie unter 1. dargelegt versucht Suchmaschinen zu manipulieren. Das haben vor vielen Jahren viele Website Betreiber gemacht und das hat damals wahrscheinlich auch zumindest eingeschränkt funktioniert. Die Suchmaschinenbetreiber haben darauf aber schon lange reagiert.
Die Algorithmen der Suchmaschinen sind heutezutage so ausgeklügelt, das solche (und auch andere) Tricks nicht mehr funktionieren und man meiner Meinung nach auch zu Recht das Gegenteil von dem erreicht, was man erreichen möchte.

In der Regel entsteht Duplicate Content aber unbeabsichtigt. Oft sogar unbemerkt.

Das können die Ursachen für Duplicate Content sein:

  1. Technische Ursachen.
  2. Sie betreiben einen Blog.
  3. Sie haben einen Online Shop.
  4. Sie bieten Ihre Webseiten in einer alternativen Version (zum Beispiel als druckbare Version oder pdf Datei) an.
  5. Sie haben extra Webseiten für die Darstellung auf mobilen Endgeräten erstellt.
  6. Sie sind mit Ihrer Webpräsenz auf eine neue Domain umgezogen.

Zu 1.

Technische Ursachen sind die häufigsten Ursachen dafür, das Sie unbemerkt Duplicate Content erzeugen.
Es kann sein, das Ihr Webserver Ihre Seiten einmal ohne und einmal mit www in der URL ausliefert.
Damit haben Sie jede Seite Ihrer Webpräsenz doppelt im Netz stehen.
Wenn Ihre Website (was auf jeden Fall empfehlenswert ist) über eine SSL Verbindung erreichbar ist, ist jede Ihrer Seiten auf vierfache Weise im Netz erreichbar.

Zur Veranschaulichung:

Domain: beispiel.de

Erreichbar als:

http://beispiel.de
http://www.beispiel.de
https://beispiel.de
https://www.beispiel.de

Zu 2.

Die meisten Webmaster benutzen zur Erstellung eines Blogs Content Management Systeme.
Sie können mit diesen Systemen denselben Beitrag beispielsweise unter verschiedenen Kategorien einordnen, damit dieser Beitrag vom Nutzer mit unterschiedlichen Suchbegriffen gefunden werden kann.

Viele Systeme speichern diesen Beitrag dann automatisch unter mehreren verschiedenen URLs ab, so das der gleiche Beitrag über mehrere Adressen erreichbar ist.

Beispiel:

https://www.meinblog/schwarze-schuhe/preiswerte-schwarze-schuhe.html
https://www.meinblog/schwarze-bekleidung/preiswerte-schwarze-schuhe.html
https://www.meinblog/preiswerte-sachen/preiswerte-schwarze-schuhe.html

Zu 3.

Wenn Sie einen Online Shop betreiben, haben Sie gegebenenfalls ein Produkt in sehr vielen Varianten im Angebot. Das Produkt unterscheidet sich dann beispielsweise nur in der Farbe und/oder Ausstattung. Das bedeutet, das sich die Artikelbeschreibung nur marginal unterscheidet und auch auf diese Weise sehr leicht Duplicate Content entsteht.

Zu 4.

Ihre Webseiten in alternativen Versionen anzubieten ist sinnvoll. Sie zeigen dem Besucher damit, das Sie ihm bestmöglich entgegenkommen möchten.
Lesen am Bildschirm ist anstrengend. Wenn Ihr Besucher einen langen, informativen Artikel ausdruckt, um ihn auf angenehmere Weise zu lesen oder ihn sogar zu archivieren zeigt Ihnen dann auch, das Sie wirklich interessanten Content produziert haben.
Aber natürlich entsteht auch auf diese Weise Duplicate Content.

Zu 5.

Sie sollten Ihre Website bestmöglich für die Darstellung am besten möglichst vieler unterschiedlicher mobiler Endgeräte optimieren.
Nicht nur Google dankt Ihnen das mit einem höheren Ranking.
Wenn Sie extra Seiten erstellen, die ausschließlich für die Darstellung auf mobilen Endgeräten optimiert sind, entsteht hier natürlich auch wieder Duplicate Content.

Zu 6.

Wenn Sie mit Ihrer Webpräsenz auf eine neue Domain umgezogen sind, ist Ihre Webpräsenz unter der alten Domain noch im Index von Suchmaschinen gespeichert.
Es dauert sehr lange bis Webseiten, die nicht mehr erreichbar sind von selber aus den Indizes der Suchmaschinen gelöscht werden.
Die Suchmaschinen gehen davon aus, das Ihre Website beispielsweise wegen technischer Störungen temporär nicht erreichbar sind und behalten Ihre Seiten mehrere Monate oder sogar noch länger im Index.
Das bedeutet auch hier das Duplicate Content entstanden ist:
Ihre Webpräsenz ist unter der alten Domain im Index noch gespeichert oder auch noch erreichbar und unter der neuen Domain neu indexiert.

Dieses Problem lösen Sie am besten, indem Sie eine temporäre Weiterleitung von Ihren Seiten auf der alten Domain auf Ihre Seiten der neue Domain einrichten.
Wichtig ist das Sie eine temporäre Weiterleitung und keine permanente Weiterleitung einrichten.
Bei einer temporären Weiterleitung teilen Sie der Suchmaschine mit, das der entstandene Duplicate Content nur vorübergehend existiert, so das Sie keine Abstufung im Ranking befürchten müssen.
Genauso wichtig ist, das wenn Sie ihren Besucherstrom weitgehend auf die neue Domain umgeleitet haben, die temporäre Weiterleitung abschalten und Ihre Seiten auf der alten Domain danach möglichst manuell selber aus dem Index entfernen.

Es gibt noch weitere Ursachen für Duplicate Content, die aber alle ähnlich gelagert sind.
Wenn Sie eine einzelne Seite beispielsweise unter einem anderen Namen abspeichern, ist die alte Seite ebenfalls noch im Index und die neue Seite mit gleichem Inhalt natürlich auch.
Das Problem löst sich mit der Zeit von selber oder Sie stoßen die Löschung der alten Seite aus dem Index selber an.

Unterschiedliche Sprachversionen einer Website sind grundsätzlich keine Ursache für Duplicate Content.
Suchmaschinen erkennen automatisch die Sprachversion einer Website und liefern Suchergebnisse der Sprache des Suchenden angepasst aus.
Trotzdem sollte man sicherheitshalber die Sprachversion seiner Website mittels hreflang-Attribut angeben.

zurück zum Inhaltsverzeichnis

3. Wie setzt man einen Canonical Tag?

Zuerst ist es erforderlich alle Seiten mit Duplicate Content herauszufinden.
Am einfachsten ist das über die Google Search Console möglich, in der Sie sich Seiten mit Duplicate Content anzeigen lassen können.
Wenn Sie noch kein Google Search Console Konto haben, sollten Sie sich eines anlegen.
Wenn Sie das machen, empfehle ich Ihnen auch direkt ein Google Analytics Konto zu registrieren. Beide Tools sind kostenlos nutzbar und ungemein hilfreich bei der Suchmaschinenoptimierung.
Wenn Sie ein Google Search Console Konto neu angelegt haben, dauert es ein paar Tage bis dort Daten verfügbar sind.

Haben Sie alle Seiten die Duplicate Content aufweisen identifiziert, überlegen Sie sich, welche der jeweils doppelten Seiten aus Ihrer Sicht die originale Seite sein soll.
Die originale Seite ist dann die kanonische URL (Seite).
Oft legt Google selbständig eine Seite als kanonische Seite fest, ohne das Sie selbst aktiv geworden sind. Ich empfehle Ihnen aber sich nicht auf Google zu verlassen, sondern explizit eine URL als kanonische festzulegen!
Welche Ihrer Seiten als kanonisch festgelegt werden sollte, kann man nicht so einfach pauschal beantworten.
Idealerweise die die den größten Traffic aufweist.
Wenn Ihre Seiten, wie unter 1. beschrieben, auf vierfache Weise ausgeliefert werden, legt Google von sich aus die Seite https://www.beispiel.de als kanonische Seite fest.
Dann würde ich Google auch nicht widersprechen und diese URL ebenfalls als kanonische URL festlegen.
Das ist auch sinnvoll, da diese URL eine verschlüsselte ist.

Alle Seiten die Duplicate Content aufweisen, werden mit einem Canonical Tag ausgezeichnet.

Das bewerkstelligen Sie, indem Sie im Kopf Bereich der betroffenen Seiten also zwischen

<head>
...
</head>

einen Canonical Tag einfügen der beispielsweise so aussehen kann:

<link rel="canonical" href="https://www.beispiel.de/beispiel.html">

Die URL: https://www.beispiel.de/beispiel.html ist natürlich durch Ihre eigene URL zu ersetzen.

Suchmaschinen erkennen dann das die Seite, die einen Canonical Tag enthält, eine Seite ist, die Duplicate Content enthält.
Dementsprechend werden die betroffenen Seiten im Ranking nicht heruntergestuft. Die doppelten Seiten werden weiterhin gecrawlt aber seltener.
Indiziert werden sie von Google aber nicht mehr. Das ist aber nicht weiter schlimm. Die kanonische URL ist indiziert und wenn ein Besucher auf Ihrer Webpräsenz ist, sind die Seiten mit Duplicate Content ja nach wie vor über Ihre Webpräsenz auffindbar und aufrufbar.

zurück zum Inhaltsverzeichnis


Die Datei wurde zuletzt aktualisiert am: 24.10.2020