Canonical Tags um Duplicate Content zu vermeiden, mein Fazit

Sunday, March 28, 2010 6:20:42 PM (Mitteleuropäische Sommerzeit, UTC+02:00)

Vor einer Woche hatte ich ein kleines Experiment gestartet, das zeigen sollte, wie gut sich Canonical Tags eignen um dem von ASP.NET erzeugten Duplicate Content entgegen zu wirken.

Wie angekündigt möchte ich meine Beobachtungen hier festhalten.
Am Sonntagabend hatte ich den Canonical Tag auf der Seite http://dotnet-forum.de/DeveloperBlogs/ eingebaut der auf die Seite selbst zeigt. Meine Erwartungen waren, das Google alle ähnlichen URLs aus dem Index nimmt.
Mit 'ähnlichen Seiten' meinte ich URLs mit und ohne default.aspx sowie URLs mit Unterschieden bei der Groß- und Kleinschreibung.
Bereits am Montagmorgen konnte man erste Änderungen in den Suchergebnissen beobachten.
Die URL auf die das Canonical Tag zeigt, wurde als erstes genannt. Es folgten 4 andere Suchergebnisse mit ähnlichen URLs. Diese vier wurden zunächst ausgeblendet und Google zeigte diese Meldung an:

Duplicate-Content

Nach Klick auf den Link zeigte Google die restlichen 4 Ergebnisse an.
Damit wurde deutlich, dass Google quasi über Nacht gelernt hatte, welche Seite die eigentliche Quellseite war.
Im Laufe der Woche zeigte Google dann nur noch drei ähnliche URLs an, ich denke das sich dieser Trend fortsetzen wird.

Fazit: Canonical Tags funktionieren um Google deutlich zu machen welche Seite die eindeutige Quelle ist, auch wenn gezielte 301 Weiterleitungen sicher effizienter wären.

Als Nachteile möchte ich zwei Aspekte erwähnen.
Der Wartungsaufwand dieser Canonical Tags ist nicht zu unterschätzen! Weiterhin sollte man nicht vergessen was für ein mächtiges Werkzeug man in der Hand hat, ein besonders gutes Beispiel hat René Kuss im Kommentar auf den ersten Blogpost gezeigt.
Um die eigentlich unsichtbaren Tags im Firefox sichtbar zu machen, kann man prima dieses Add-In verwenden.

Wenn ihnen der Artikel gefallen hat oder er für sie hilfreich war,
bitte "kicken" sie ihn.

Kick it on dotnet-kicks.de


Duplicate Content auf der Default.aspx mit dem Canonical Tag vermeiden?

Sunday, March 21, 2010 11:41:28 PM (Mitteleuropäische Zeit, UTC+01:00)

In meinem letzten Blogpost berichtete ich über ein Webslice im dotnet-forum.de und wie sich dies negativ auf den organischen Traffic aus Suchmaschinen ausgewirkt hat. Stefan Walcher nahm diesen Artikel zum Anlass, das Forum mal genauer unter die SEO Lupe zu nehmen. Er hat einige sehr interessante Verbesserungsmöglichkeiten aufgezeigt. besonders bei der Gliederung der Überschriften ist noch einiges zu tun. Hier hat Telligent mit dem CommunityServer keine gute Arbeit geleistet und ich habe bei der Erweiterung des Forums sicher auch die ein oder andere SEO -Todsünde begangen.

Nun aber zurück zum Thema. Bei ASP.NET gibt es immer wieder folgende Situation, die unweigerlich zu Duplicate Content führt:

Man legt in einem Verzeichnis eine Default.aspx an, z.B. /DeveloperBlogs/Default.aspx
Ist die Default.aspx im IIS als Standartseite definiert, ist die Webseite mit und ohne Default.aspx erreichbar.

IIS6-DuplicateContent

Wenn jetzt einmal mit und einmal ohne Default.aspx auf diese Seite verlinkt wird, lernt Google sehr schnell, dass der gleiche Content unter zwei verschiedenen URLs erreichbar ist, dies nennt man Duplicate Content.
Warum Duplicate Content schlecht für das Ranking ist, erklärt Google selbst:

Zitat:
Falls Ihre Website duplizierten Content enthält und Sie nicht den oben beschriebenen Tipps folgen, tun wir unser Bestes, eine Version des Contents in unseren Suchergebnissen anzuzeigen. […]
Wenn wir nicht in der Lage sind, alle Duplikate einer bestimmten Seite zu identifizieren, dann können wir diese nicht entsprechend zusammenfassen. Dies könnte die Stärke der einzelnen Rankingsignale dieses Contents mindern, da sie über verschiedene URLs aufgeteilt sind.
(Quelle
)

Wie man Duplicate Content mit ASP.NET vermeiden kann, hat Klaus Bock hier schon einmal erklärt.
Ich habe es im Fall der DeveloperBlogs heute nicht mit einem 301-Redirect sondern mit einem Canonical Tag versucht. Ob es funktioniert kann ich noch nicht sagen. Ich werde in Kürze berichten ob eine der beiden Seiten durch diese Maßnahme aus dem Google Index verschwindet.

Was ist ein Canonical Tag?

Microsoft, Google und Yahoo haben sich dieses Link-Konstrukt ausgedacht, damit Webmaster eine einfache Möglichkeit haben, die Quelle von doppeltem Content anzugeben. Der Link wird im HEAD der Webseite untergebracht und zeigt mit dem href Atribut auf die eigentliche Quelle.
Mehr über diesen Link kann bei Googlewebmastercentral nachgelesen werden.
Den Canonical Tag hab ich auf der Seite http://dotnet-forum.de/DeveloperBlogs/Default.aspx platziert:

<link rel="canonical" href=http://dotnet-forum.de/DeveloperBlogs/ />

In den Kommentaren auf Googlewebmastercentral hat Google die Frage beantwortet, ob es sich negativ auswirkt, wenn eine Webseite mit dem Canonical Tag auf sich selbst zeigt.
Zitat:
Die URL, auf die mittels rel="canonical" verwiesen wird, kann auch einen entsprechenden Verweis auf sich selbst beinhalten - das ist vollkommen in Ordnung.(Quelle)

Es ist also nicht schlimm wenn ich diesen Canonical Tag immer auf der Default.aspx einblende.
So brauch ich im Code-Behind keine Logik, die rausfindet, ob die Seite mit oder ohne Default.aspx aufgerufen wurde.

Sollte das Experiment erfolgreich sein, und meinen doppelten Content aus dem Index werfen, werd ich den Canonical Tag in alle Default.aspx (meine Standardinhaltsseite) einbauen.

Wenn ihnen der Artikel gefallen hat oder er für sie hilfreich war,
bitte "kicken" sie ihn.

Kick it on dotnet-kicks.de


Webslice, böse SEO Falle

Monday, March 08, 2010 11:30:25 PM (Mitteleuropäische Zeit, UTC+01:00)

Im Rahmen des EYSA Wettbewerbs hatte ich den ein oder anderen Webslice entwickelt. Unter anderem hab ich auch einen Webslice für das dotnet-forum.de erstellt, der die aktuellen Beiträge anzeigt.
Ein Webslice ist nichts anderes, als ein DIV Container in der HTML-Seite, der mit einem Inlinestyle-Attribut  ausgeblendet wird (style="display: none").
Durch die CSS Klasse hslice erkennt der IE8 diesen DIV Container als Webslice und zeigt ihn nach der Installation an:

webslice

So weit so gut, das Webslice funktioniert. Als ich das Webslice damals erstellt hatte, habe ich mich an Beispielen aus der MSDN orientiert und die Headline des Webslice als H2 eingebaut:

Webslice-code 


Und genau diese Notation hat den Besucherstrom, der über Google ins Forum kommt, drastisch reduziert. Google hat diese H2 Headline für so wichtig gehalten, das dieser Text in den Google Suchergebnissen immer als Headline angezeigt wurde. Bsp:

serps 

Wer klickt schon auf "Aktuelle Beiträge aus dem dotnet-forum.de" wenn man nach "WMI Abfrage für Ereignisprotokoll" gesucht hat?

Das Verhalten von Google ist für mich vollkommen unverständlich, denn zum einen ist der DIV Container ausgeblendet und zum anderen ist auf der entsprechenden Seite eine ordentliche META Description und eine H1 Headline vorhanden. Beide sind besser für die Headline der Suchergebnisse geeignet.

Behelfen kann man sich, in dem man das H2 entfernt und durch ein SPAN ersetzt:

<span class="entry-title">Aktuelle Beiträge aus dem dotnet-forum.de</span>

Wenn ihnen der Artikel gefallen hat oder er für sie hilfreich war,
bitte "kicken" sie ihn.

Kick it on dotnet-kicks.de