Duplicate Content auf der Default.aspx mit dem Canonical Tag vermeiden?

Sunday, March 21, 2010 11:41:28 PM (W. Europe Standard Time, UTC+01:00)

In meinem letzten Blogpost berichtete ich über ein Webslice im dotnet-forum.de und wie sich dies negativ auf den organischen Traffic aus Suchmaschinen ausgewirkt hat. Stefan Walcher nahm diesen Artikel zum Anlass, das Forum mal genauer unter die SEO Lupe zu nehmen. Er hat einige sehr interessante Verbesserungsmöglichkeiten aufgezeigt. besonders bei der Gliederung der Überschriften ist noch einiges zu tun. Hier hat Telligent mit dem CommunityServer keine gute Arbeit geleistet und ich habe bei der Erweiterung des Forums sicher auch die ein oder andere SEO -Todsünde begangen.

Nun aber zurück zum Thema. Bei ASP.NET gibt es immer wieder folgende Situation, die unweigerlich zu Duplicate Content führt:

Man legt in einem Verzeichnis eine Default.aspx an, z.B. /DeveloperBlogs/Default.aspx
Ist die Default.aspx im IIS als Standartseite definiert, ist die Webseite mit und ohne Default.aspx erreichbar.

IIS6-DuplicateContent

Wenn jetzt einmal mit und einmal ohne Default.aspx auf diese Seite verlinkt wird, lernt Google sehr schnell, dass der gleiche Content unter zwei verschiedenen URLs erreichbar ist, dies nennt man Duplicate Content.
Warum Duplicate Content schlecht für das Ranking ist, erklärt Google selbst:

Zitat:
Falls Ihre Website duplizierten Content enthält und Sie nicht den oben beschriebenen Tipps folgen, tun wir unser Bestes, eine Version des Contents in unseren Suchergebnissen anzuzeigen. […]
Wenn wir nicht in der Lage sind, alle Duplikate einer bestimmten Seite zu identifizieren, dann können wir diese nicht entsprechend zusammenfassen. Dies könnte die Stärke der einzelnen Rankingsignale dieses Contents mindern, da sie über verschiedene URLs aufgeteilt sind.
(Quelle
)

Wie man Duplicate Content mit ASP.NET vermeiden kann, hat Klaus Bock hier schon einmal erklärt.
Ich habe es im Fall der DeveloperBlogs heute nicht mit einem 301-Redirect sondern mit einem Canonical Tag versucht. Ob es funktioniert kann ich noch nicht sagen. Ich werde in Kürze berichten ob eine der beiden Seiten durch diese Maßnahme aus dem Google Index verschwindet.

Was ist ein Canonical Tag?

Microsoft, Google und Yahoo haben sich dieses Link-Konstrukt ausgedacht, damit Webmaster eine einfache Möglichkeit haben, die Quelle von doppeltem Content anzugeben. Der Link wird im HEAD der Webseite untergebracht und zeigt mit dem href Atribut auf die eigentliche Quelle.
Mehr über diesen Link kann bei Googlewebmastercentral nachgelesen werden.
Den Canonical Tag hab ich auf der Seite http://dotnet-forum.de/DeveloperBlogs/Default.aspx platziert:

<link rel="canonical" href=http://dotnet-forum.de/DeveloperBlogs/ />

In den Kommentaren auf Googlewebmastercentral hat Google die Frage beantwortet, ob es sich negativ auswirkt, wenn eine Webseite mit dem Canonical Tag auf sich selbst zeigt.
Zitat:
Die URL, auf die mittels rel="canonical" verwiesen wird, kann auch einen entsprechenden Verweis auf sich selbst beinhalten - das ist vollkommen in Ordnung.(Quelle)

Es ist also nicht schlimm wenn ich diesen Canonical Tag immer auf der Default.aspx einblende.
So brauch ich im Code-Behind keine Logik, die rausfindet, ob die Seite mit oder ohne Default.aspx aufgerufen wurde.

Sollte das Experiment erfolgreich sein, und meinen doppelten Content aus dem Index werfen, werd ich den Canonical Tag in alle Default.aspx (meine Standardinhaltsseite) einbauen.

Wenn ihnen der Artikel gefallen hat oder er für sie hilfreich war,
bitte "kicken" sie ihn.

Kick it on dotnet-kicks.de