SEO-Sunday – Umlaute und Sonderzeichen
Umlaute und Sonderzeichen in allen Bereichen von Websites sind für viele Softwareentwickler ein Reizthema. Teilweise wird die Thematik mit nahezu religiösem Eifer disskutiert. Doch ist das Thema überhaupt der Rede Wert? Hat eine Entscheidung für oder gegen Umlaute in URIs und im Text Auswirkungen auf die Suchmaschinenoptimierung?
Eigentlich sollte dieses Thema zu keinerlei Disskussion führen, denn seit der Einführung des UTF-8 Zeichensatzes können wir sauber in jedem halbwegs modernen Betriebssystem jedes erdenkliche Zeichen darstellen. Leider ist das nicht ganz so einfach, wie man sich das vorstellen mag, denn ein Buchstabe ist nicht einfach nur ein Buchstabe. Je nach Zeichensatz verbraucht der Buchstabe unterschiedlich viel Speicherplatz und wird im URI (dass ist jener Bestandteil der unmittelbar nach dem URL folgt (www.ranking-check.de/blog) unterschiedlich kodiert. Aus historischen Gründen wird bei der Webadresszuordnung ausschließlich der ASCII Zeichensatz verwendet. Dieser kennt leider keine Umlaute. Deshalb wird in Internetadressen der Begriff Äpfel in Abhängigkeit von Zeichensatz unterschiedlich dargestellt.
In der UTF-8 Kodierung sieht das Wörtchen “Äpfel” so aus: %C3%84pfel
Im Standard-Latin-1 Zeichensatz für Deutschland (ISO-8859-1) sieht das ganze so aus: %C4pfel
Beides ist im URI zugelassen. In der Regel werden Umlaute allerdings noch etwas anders dargestellt. Die am häufigsten verbreitete Schreibweise dürfte wohl “Aepfel” lauten. Doch je nach Content-Management-System wird daraus auch schnell mal “Apfel” (z.B. bei WordPress).
Welche Schreibweise ist denn nun richtig? Welche sinnvoll?
Die ersten beiden sind korrekt, die dritte ist eine Behelfslösung, die vierte ist falsch! Für Ideal halte ich die Kodierung im ersten Format, denn UTF-8 ist nunmal der neue Standard. Leider ist das korrekte Auslesen solcher URLs Softwareseitig mitunter aufwändig, weshalb die Hilfslösung mit ae, oe, ue und ss erheblich häufiger anzutreffen ist.
SEO-Aspekte
Bei der Entwicklung meines letzten Webportals kam nun die Frage erneut auf. Nicht, weil ich nicht wüsste, ich damit umgehen sollte und wollte, sondern weil der Kunde die UTF-8 Schreibweise unschön fand. Wird eine solche Adresse per Mail verschickt bekommt sie mangels Bildung des Empfängers möglicherweise einen anrüchigen Touch. Mein Hauptargument dagegen:
Wikipedia macht es auch so. Nun reicht mir sowas üblicherweise nicht aus. Deshalb habe ich ein kleines SEO-Experiment gestartet. Nach der manuellen Überprüfung einiger Keywords bei Google kann ich folgendes definitv sagen: Während die erstgenannten Kodierungen keinerlei unterschiede hinsichtlich der Serps aufweisen, kommt es bei der dritten Variante zu Abweichungen bei der Suchmaschinenpositionierung. Wir erfassen diese Abweichungen gerade im großen Stil, so dass ich im Laufe der kommenden Woche hier einen entsprechenden Report vorlegen werde.
Bis dahin wünsche ich allen Lesern noch eine angenehme Arbeitswoche.


fiacyberz Schrieb am
3. August, 2010 @ 10:01
Bin gespannt auf den Report diese Woche
Das Problem besteht nebenbei auch in sitemaps. Diese können ja auch unterschiedlich kodiert sein, aber werden sie automatisch erstellt kann es Probleme geben und Google diese evtl nicht lesen.
Heiko Schrieb am
3. August, 2010 @ 10:03
Auf den Report bin ich gespannt! Spannend übrigens auch dass Google “aepfel” zu “apfel” rechnet… Und was Sonderzeichen angeht hatte ich auch mal was getestet:
http://www.google.de/#hl=de&source=hp&q=%CA%87%C9%B9%C7%9D%CA%9E%C9%94%C7%9D+o%CA%9E%C4%B1%C7%9D%C9%A5&aq=f&aqi=&aql=&oq=&gs_rfai=&fp=bdefb02920794569
Patrick Schrieb am
3. August, 2010 @ 11:28
Ich habe in meinem title zu stehen “SEO & Social Media”. Wer lesen kann, hat damit keine Probleme. Google jedoch hat damit eines und die alte Version von WordPress hat diesbezüglich auch gestreikt.
Als kleine Notlösung wollte ich “&” durch “&” ersetzen, doch wie eben schon gesagt, hat WordPress diese Zeichensetzung im title nicht akzeptiert, woraufhin mein Titel auf manchen Seiten falsch angezeigt wurde.
Zum Glück hat das Update dem ein Ende bereitet.
Grüße
Patrick