Codierung von Umlauten

Entgegen einem weit verbreiteten Irrglauben müssen die deutschen Umlaute, das Ess-Zett sowie weitere Sonderzeichen nicht unbedingt als benannte Zeichen notiert werden. Die sog. benannten Zeichen sind in HTML Abkürzungen oder voll ausgeschriebene Namen für bestimmte Zeichen. Beispiel: ein "Ä" kann in einem HTML-Dokument als "Ä" geschrieben werden.

Ab HTML 4.0 kann mit einer Meta-Angabe im HTML-Kopf der Zeichensatz angegeben werden, der innerhalb des Dokuments verwendet wird. Wenn das Dokument mit einem Editor erzeugt wird, der ebenfalls diesen Zeichensatz verwendet, kann Text direkt in deutsch, russisch, isländisch, usw. geschrieben werden. Die Angabe des Zeichensatzes ist für den Server und für den Browser wichtig, denn sie legt fest, nach welchem Zeichensatz das Dokument im Zweifelsfall zu interpretieren ist. Für eine korrekte Darstellung im Browser muss ein entsprechender Zeichensatz auf dem Gerät des Anwenders vorhanden sein.

Die deutschen Sonderzeichen sind im Zeichensatz ISO-8859-1 (Latin-1) enthalten. Dieser Zeichensatz enthält die Zeichen für die meisten westeuropäischen und amerikanischen Sprachen.

In der nachfolgenden Tabelle habe ich verschiedene Zeichen der deutschen Sprache jeweils unterschiedlich codiert. Die Darstellung des Browsers seht ihr in der rechten Spalte. Dem Dokument liegt der Zeichensatz ISO-8859-1 (Latin-1) zugrunde.

Zeichen Codierung im Dokument Darstellung im Browser
a-Umlaut ä ä
a-Umlaut ä ä
o-Umlaut ö ö
o-Umlaut ö ö
u-Umlaut ü ü
u-Umlaut ü ü
A-Umlaut Ä Ä
A-Umlaut Ä Ä
O-Umlaut Ö Ö
O-Umlaut Ö Ö
U-Umlaut Ü Ü
U-Umlaut Ü Ü
Ess-Zett ß ß
Ess-Zett ß ß
Anführungszeichen oben " "
Anführungszeichen oben " "
Paragraphen-Zeichen § §
Paragraphen-Zeichen § §

Wenn für die Sonderzeichen keine benannten Zeichen verwendet werden, kann es bei der Darstellung Probleme geben, wenn