Spätestens seit dem berühmten Pinguin-Update vom 24. April 2012 ist jedem klar geworden, dass doppelter Content auf Webseiten (duplicate content) von Google als verdächtig eingestuft wird und sich nicht positiv auf die Ranking-Entwicklung einer Webseite auswirken wird. Was bereits im Internet irgendwo geschrieben steht, sollte in keinster Weise einfach kopiert werden, um an einem anderen Ort im Internet veröffentlicht zu werden.
Blog- oder Onlineshop-Betreiber wissen, dass es jedoch oft nicht einfach ist, doppelten Content auf der eigenen Webseite zu vermeiden. Zum Beispiel wird ein frisch veröffentlichter Artikel auf einem Blog auf der Startseite zum einen als Textauszug (Teilauszug des Artikels) angezeigt. Zum anderen erscheint der Artikel auf der eigenständigen Artikelseite (URL). Darüber hinaus ist der Artikel auch über Kategorie- und Tag-Suche erreichbar und es wird dem Artikel erneut eine neue Seite (URL) zugewiesen.
Ein und derselbe Content ist also auf verschiedenen Seiten (URLs) der gleichen Webseite verfügbar. Und damit produzieren wir den nicht gewollten doppelten Content:
http://www.seotexter.net/
http://www.seotexter.net/kategorie/beispielkategorie
http://www.seotexter.net/tag/beispieltag
http://www.seotexter.net/beispielartikel
Für diese Problematik gibt es eine einfache Lösung: Wir teilen Google mit, dass die Kategorie- und Tag-Seiten nicht beachtet werden sollen, also nicht indiziert werden sollen (noindex).
Es gibt folgende Möglichkeiten, wenn Sie mit WordPress arbeiten:
1. WordPress-Plugin wie das Yoast SEO-Plugin
Hier kann der Administrator im Dashboad in den Einstellungen des Plugin die Kategorieseiten und die Tagseiten auf noindex setzen.
2. WordPress-Plugin WP Robots Txt
Hier kann der Administrator im WordPress Dashboard unter Einstellungen (Lesen / Reading) bestimmten, welche Seiten von Google ausgeschlossen werden sollen (disallow).
3. WordPress-Plugin WordPress Meta Robots
Dies Plugin ermöglicht dem Administrator, einzelne Seiten (pages) und Beiträge (posts) auf noindex zu setzen. Zum Beispiele wird die “Impressum” oder “Über uns” – Seiten gerne auf noindex gesetzt.
Es ist natürlich möglich die robots.txt selbst in einem Editor zu erstellen, zu editieren und per FTP in das Stammverzeichnis (Root-Verzeichnis) der Webseite hochzuladen.