Canonical Tags: Duplicate Content vermeiden
Der Canonical Tag (rel="canonical") ist deine wichtigste Verteidigung gegen Duplicate Content. Er
sagt Suchmaschinen, welche Version einer URL die „Master"- oder Hauptkopie ist, und stellt sicher, dass deine
Ranking-Signale nicht über mehrere identische Seiten hinweg verwässert werden.
1. Was ist ein Canonical Tag?
Ein Canonical Tag ist ein HTML-Snippet, das sich im <head> einer Webseite befindet. Er gibt
die „kanonische URL" an – die bevorzugte URL, die Suchmaschinen indexieren und ranken sollen.
Wenn du exakt denselben (oder einen sehr ähnlichen) Inhalt unter mehreren URLs verfügbar hast, geraten Suchmaschinen durcheinander. Sie wissen nicht, welche Version sie indexieren, welche sie ranken oder wie sie die Link-Equity (Backlinks) konsolidieren sollen, die auf diese Seiten zeigt. Der Canonical Tag löst das.
2. Warum sind Canonical Tags wichtig?
Duplicate Content passiert häufiger, als du denkst. E-Commerce-Plattformen, CMS-Systeme und Tracking-Parameter erzeugen oft mehrere URLs für dieselbe Seite:
- Tracking-Parameter:
example.com/shoes?utm_source=email - Sortierung/Filterung:
example.com/shoes?sort=price_asc - Session-IDs:
example.com/shoes?sessionid=123 - WWW vs. Non-WWW:
www.example.comvsexample.com - HTTP vs. HTTPS:
http://example.comvshttps://example.com
Ohne Canonical Tag sieht Google all diese als separate Seiten. Der Canonical Tag konsolidiert alle Ranking-Signale und die Link-Equity auf deine einzige, bevorzugte URL.
Warnung: Ein Canonical Tag ist ein Hinweis, keine strikte Anweisung. Wenn dein Canonical Tag auf eine Seite mit völlig anderem Inhalt zeigt oder wenn dir Implementierungsfehler unterlaufen, kann Google deinen Hinweis ignorieren und selbst eine kanonische URL auswählen.
3. HTML-Code-Beispiel
Der übliche Weg, einen Canonical Tag zu implementieren, ist innerhalb des <head>-Bereichs deines
HTML-Dokuments.
Wenn ein Nutzer die URL https://www.rankosaur.com/features/?sort=recent aufruft, sollte das HTML der Seite
den folgenden Tag enthalten, der auf die saubere, primäre URL zurückverweist:
<!DOCTYPE html>
<html>
<head>
<link rel="canonical" href="https://www.rankosaur.com/features/" />
</head>
<body>
<!-- Seiteninhalt -->
</body>
</html>
4. Canonical im HTTP-Header
Wenn du Nicht-HTML-Dateien (wie PDF-Dokumente oder Bilder) kanonisieren musst, bei denen du keinen HTML-
<head>-Bereich einfügen kannst, musst du den Canonical-Link über den HTTP-Response-Header senden.
Beispiel einer HTTP-Header-Antwort:
HTTP/1.1 200 OK
Content-Type: application/pdf
Link: <https://www.rankosaur.com/seo-guide.html>; rel="canonical"
5. Best Practices
- Verwende absolute URLs: Nutze immer absolute URLs
(
https://www.example.com/page/) statt relativer URLs (/page/). Relative URLs können leicht kaputtgehen, wenn die Seitenarchitektur falsch gehandhabt wird. - Selbstreferenzierende Canonicals: Es wird dringend empfohlen, dass jede Seite einen Canonical Tag hat, der auf sich selbst verweist (sofern sie die Master-Version ist). Das verhindert, dass Scraper-Seiten oder URL-Parameter versehentlich Duplicate Content erzeugen.
- Domainübergreifende Canonicals: Du kannst Canonical Tags auch über verschiedene Domains hinweg verwenden. Wenn du einen Artikel in deinem Blog veröffentlichst und ihn auf Medium oder einem anderen Publisher syndizierst, sollte der syndizierte Artikel einen Canonical Tag haben, der auf deinen Originalbeitrag zurückverweist.
- Verwende Kleinbuchstaben-URLs: Da Suchmaschinen Groß- und Kleinbuchstaben als unterschiedliche URLs behandeln, solltest du in deinen Canonical Tags immer Kleinbuchstaben-URLs erzwingen.
6. Häufige Fehler, die du vermeiden solltest
- Canonical mit Noindex vermischen: Setze niemals einen
noindex-Tag auf eine Seite und habe gleichzeitig einen Canonical Tag, der auf eine andere Seite zeigt. Das sind widersprüchliche Signale. (Noindex sagt „nimm diese Seite aus dem Index", Canonical sagt „gib die Equity dieser Seite an eine andere Seite weiter"). Verwende das eine oder das andere. - Paginierte Seiten auf Seite 1 kanonisieren: Verweise niemals
/blog?page=2auf/blog. Das führt dazu, dass Google aufhört, deine paginierte Serie zu crawlen, was bedeutet, dass deine älteren Artikel aus dem Index fallen. Paginierte Seiten sollten einen selbstreferenzierenden Canonical Tag haben. - Mehrere Canonical Tags: Wenn eine Seite zwei Canonical Tags hat, die auf unterschiedliche URLs zeigen (oft verursacht durch mehrere installierte SEO-Plugins), wird Google einfach beide Tags ignorieren.
- Auf eine 404 oder eine Weiterleitung kanonisieren: Stelle sicher, dass deine kanonische URL einen
200 OK-Statuscode zurückgibt. Einen Canonical Tag auf eine tote Seite oder eine Weiterleitungskette zu richten, verschwendet Crawl-Budget und verwirrt Suchmaschinen.
Profi-Tipp: Mit Rank-O-Saur siehst du sofort den aktiven Canonical Tag jeder Seite, die du besuchst, und kannst prüfen, ob er mit der aktuellen URL übereinstimmt (selbstreferenzierend) oder woanders hinzeigt.