Duplicate Content vermeiden

Das Ziel von Google ist es, die relevantesten Seiten zu einem Thema herauszufiltern. Nutzer einer Suchmaschine werden sie schließlich auch nur dann dauerhaft aufsuchen, wenn sie mit den Ergebnissen ihrer Suche zufrieden sind. Zudem sollen aus Google-Sicht natürlich die Ressourcen für das Crawling, also den Besuch von Googlebots auf einer Webseite, nicht sinnlos verpulvert werden, weil damit ein großer Teil der Hardwareleistungen verbraucht wird. Duplicate Content sollte aus eben diesem Grund vermieden werden, denn Google straft diese mehrfach vorhandenen Inhalte mit einer schlechten Bewertung ab. Nun kann man natürlich die Indexierung vermeiden, denn wenn Google nicht mehr als die reine URL lesen darf, wird auch der Duplicate Content von den Suchbots nicht gefunden. Das macht vor allem für Shops Sinn, denn wenn ein Produkt in verschiedenen Ausführungen zu haben ist, gibt es meist nur eine Beschreibung dafür und damit würde Google Duplicate Content erkennen.
Natürlich ist es eine Überlegung wert, jedem Artikel eine eigene Beschreibung zu geben, doch in vielen Fällen ist das schlichtweg nicht machbar. Ein Pullover in 10 Farben und verschiedenen Größen würde hier schon den Rahmen sprengen. Es gibt verschiedene Möglichkeiten Google mitzuteilen, welche Seiten indexiert werden sollen und welche nicht. Grundsätzlich sollte man sich für eine Nicht-Indexierung von Seiten entscheiden, die eines der folgenden Kriterien erfüllen. Seiten mit sehr wenig oder sich wiederholendem Content sollten nicht indexiert werden, ebenso wie Kategorie-Seiten, automatisch generierte Tag-Seiten und Affiliate URLs sollten ebenfalls nicht in den Google-Index aufgenommen werden. Nun werden Seiten, die nicht in den Index aufgenommen werden sollen, aber trotzdem gecrawlt und das verbraucht wiederum Ressourcen. Da nur eine bestimmte Anzahl davon von Google zur Verfügung gestellt wird, kann es passieren, dass indexierbare Unterseiten nicht mehr aufgesucht werden. Dann dauert es ewig, bis neue Inhalte im Index auftauchen. Hier schafft allerdings Google selbst Abhilfe. Mit dem Tool zur Parameterbehandlung lässt sich einstellen, welche Seiten nicht gecrawlt werden sollen und das schont die Ressourcen für die wichtigen Indexseiten.








