Editor's Choice

Duplicate Content und die Folgen bei Google

Suchmaschinen eliminieren doppelte Inhalte im Netz

Geliebt und gefürchtet: Suchmaschinenriese Google - Wilhelm Ruprecht Frieling
Geliebt und gefürchtet: Suchmaschinenriese Google - Wilhelm Ruprecht Frieling
Obwohl der Suchmaschinengigant Google versucht, die Wogen zu glätten, bleibt das Thema Duplicate Content ein rotes Tuch für jeden, der Inhalte im Web veröffentlicht.

Duplicate Content, oft schlicht mit den Buchstaben DC abgekürzt, sind doppelte, also identische Inhalte im Netz. Derartige Dubletten gibt es viele.

Viele Autoren wollen an möglichst unterschiedlichen Stellen erwähnt werden, weil sie sich davon mehr Aufmerksamkeit und Absatz erhoffen. Insofern werden identische Texte unter verschiedenen URLs (Webadressen) eingestellt oder schlicht und einfach kopiert. Eine derartige Vorgehensweise produziert indes das genaue Gegenteil.

Google durchkämmt systematisch das Netz

Googles Robots und Spider gleichen nämlich systematisch sämtliche im Netz indizierten Texte ab. Stellen sie doppelte Inhalte fest, werden diese aus ihren Verzeichnissen gelöscht. Dabei wird davon ausgegangen, dass es sich bei derartigen Doppelungen um Werbemüll handelt, der nicht in eine Suchmaschine gehört.

Im Ergebnis wird der Rang der Dokumente geändert. Das Dokument mit mehr PageRank wird als „normal“ eingestuft, Kopien davon landen im „sekundären Index“. Der Rang der jeweiligen Seite wird von der Google-Software nach einem geheimen, immer wieder im Web diskutierten Page-Rank-Algorithmus ermittelt. Es ist den Maschinen dabei egal, auf welcher Domain das Original oder die Kopie liegt, sie gehen rein mechanisch vor.

Jeder halbwegs fitte Netzmensch legt deshalb Wert darauf, Doppelungen zu vermeiden. Es ist nämlich nach dem derzeitigen Stand der Technik kontraproduktiv, einen Text mehrfach einzustellen oder einen Nachdruck uneingeschränkt zu gestatten.

Doppelte Inhalte werden bestraft

Die Maßnahmen von Google haben erhebliche Verunsicherung unter Netzadministratoren und Webdesignern ausgelöst. Völlig genervt von tausenden Anfragen wurde unlängst im offiziellen Google-Blog „Webmaster-Zentrale“ erklärt, es gebe keinen Duplicate Content-Penalty. Darunter sind Strafen zu verstehen, die meist mit einem automatischen Herabstufen des Page Ranks der jeweiligen Seite verbunden ist.

Gleichzeitig erklärt Google jedoch: „Es gibt einige Penalties, die mit dem Konzept zusammenhängen, dass eine Site den gleichen Content hat wie eine andere Site. Wenn ihr beispielsweise Content von anderen Sites unerlaubt übernehmt und diesen wieder veröffentlicht, oder falls ihr Content wieder veröffentlicht, ohne Mehrwert hinzuzufügen.“

Damit wird von der wichtigsten Suchmaschine offiziell klar gestellt, dass jeder Seitenbetreiber gut beraten ist, doppelte Inhalte zu vermeiden.

Das hilft gegen Duplicate Content

Die am besten geeignete Maßnahme gegen Duplicate Content ist, eventuell herumschwirrende Dubletten so schnell wie möglich los zu werden. Vor allem für Blogs gilt, dass sie ihren Rang bei Google kaum steigern werden, wenn sie auf eigene Inhalte verzichten und sich auf den Abdruck von Texten reduzieren, die andere geschaffen haben. Dabei sei an dieser Stelle die rechtliche Problematik des unerlaubten Nachdruckens von urheberrechtlich geschützten Inhalten außen vor gelassen.

Besonders problematisch wird es, wenn eine bestehende, mit Inhalten gefüllte Seite nicht mehr weiter betrieben wird, der Betreiber jedoch eine neue URL nutzt und dort die gleichen Inhalte erneut, vielleicht optisch besser aufbereitet, einstellt. Hier sollte überlegt werden, die alte Seite komplett zu löschen.

Canonical Meta-Tag

Um die Webadministratoren zu beruhigen, führte Google im Februar 2009 den Canonical Meta-Tag ein. Zweck der Anweisung soll sein, das Problem mit Duplicate Content zu lösen.

Dazu fügt man im HEAD-Bereich der HTML-Seite eine Anweisung ein, die den jeweiligen Suchmaschinen (neben Google sind das vor allem Yahoo und Microsoft) mitteilt, dass die Originalversion dieser Seite womöglich unter einer anderen URL zu finden ist. Diese andere URL wird dabei natürlich ebenfalls angegeben. Diese Arbeitsweise verlangt allerdings tiefere Kenntnis vom Seitenaufbau und kommt für den privaten Blogger oder Webseitenbetreiber kaum infrage.

Lösungsansätze der Problematik können auch darin gesehen werden, Artikel – und besonders deren Überschriften, Anreißer und Schlagworte - so zu verändern, dass eigenständige Arbeiten daraus werden. Das ist allerdings mit Aufwand verbunden.

Tricks für Blogger

Bei Blogs bietet sich an, lediglich die ersten Zeilen zu publizieren und den interessierten Leser mit einem „Read more“-Verweis auf den Originalbeitrag zu locken.

Die Thematik der doppelten Inhalte und ihre Behandlung durch Suchmaschinen ist noch lange nicht ausdiskutiert. Fakt ist aber, dass täglich Unmengen neuer Inhalte ins Netz gestellt werden und Suchmaschinenbetreiber im Interesse der Millionen User technische Lösungen suchen, um der wachenden Dublettenflut Herr zu werden.

Wilhelm Ruprecht Frieling, © Wilhelm Ruprecht Frieling

Wilhelm Ruprecht Frieling - Wilhelm Ruprecht Frieling aka Prinz Rupi ist seit 40 Jahren als Autor und Verleger aktiv. Er veröffentlichte in deutschen und ...

rss