Duplicate Content – grundsätzliche Definition

Duplicate Content, oftmals auch Duplicated Content, beschreibt doppelt vorhandene Inhalte auf Internetseiten. Es muss hierbei zwischen internem und externem Duplicate Content unterschieden werden. Für Webseitenbetreiber sind diese doppelt vorhandenen Inhalte besonders hinsichtlich des Google Rankings ein Problem. Die Suchmaschine kann sie als Betrugsversuch interpretieren, wodurch es zu einer Strafe seitens Google kommen kann.

Ein Text, der in verschiedenen Sprachversionen vorliegt, zählt nicht als Duplicate Content. Gleiches gilt für Zitate, sofern diese im Quellcode deutlich als solche zu erkennen sind.

Interner Duplicate Content

Interner Duplicate Content ist häufig in Webshops zu finden, die mit Kategorie- und Produktseiten arbeiten. Wenn die Detailseite eines Artikels sowohl aus der Kategorien- als auch aus der Produktseite heraus aufrufbar ist, kann sie von Suchmaschinen als Duplicate Content erkannt werden. Eine Indizierung durch die Suchmaschine findet auch statt, wenn beispielsweise externe Seiten auf beide URLs verlinken.

Beispiel für internen Duplicate Content:

http://shopurl.de/kategorie/produktseite/produktdetailseite

http://shopurl.de/produktdetailseite

Die Detailseite ist über zwei unterschiedliche URLs zu erreichen. Auf diese wurde extern verlinkt. Google erkennt das bei der Indizierung und wertet es als doppelte Inhalte. Dieses Problem tritt auch bei internen Verlinkungen auf, wenn diese nicht einheitlich sind.

Externer Duplicate Content

Wenn eine Internetseite über unterschiedliche Domains (zum Beispiel shop-url.de und shopurl.de) zu erreichen ist, muss darauf geachtet werden, die weniger wichtige Website mit einer 301-Weiterleitung auf die Hauptdomain weiterzuleiten, statt die Inhalte auf beiden Seiten online zu stellen. Anderenfalls werden die Domains als eigenständige Seiten mit identischem Inhalt behandelt. Dadurch wird das Ranking der eigentlichen Seite verfälscht, was die Platzierung in den Suchergebnissen unmittelbar beeinflusst und im schlimmsten Fall als Betrugsversuch gewertet werden kann.

Identische Inhalte, die auf verschiedenen Internetseiten bereitgestellt werden, zählen als Duplicate Content. Das gilt selbst dann, wenn eine Seite ohne Einwilligung des Urhebers kopiert wurde. Die Suchmaschinen haben nicht die Möglichkeit zu unterscheiden, welche der Domains die Inhalte kopiert hat, ohne über das entsprechende Urheberrecht zu verfügen.

Maßnahmen zur Vermeidung von Duplicate Content

Es gibt unterschiedliche Möglichkeiten, Duplicate Content zu vermeiden. An erster Stelle steht hierbei die einheitliche Pflege von internen Verlinkungen. Wenn Inhalte auf mehreren Websites veröffentlicht werden, kann die Suchmaschine durch einen Backlink auf die Ursprungsseite zuverlässiger erkennen, welche der Seiten zu indizieren ist. Eine andere Möglichkeit ist die Verwendung des noindex-Meta-Tags, welches die Indizierung des Duplikats durch die Suchmaschinen verhindert. Die wichtigen Suchmaschinen bieten den Nutzern die Möglichkeit, eine bevorzugte Domain für die Indizierung festzulegen. Hierzu gibt es auf der Homepage der jeweiligen Suchmaschine zumeist sogenannte Webmaster-Tools. Google hat zudem eine ausführliche FAQ-Seite zum Thema Duplicate Content erstellt.