HTML Zeichensatz
- Vorherige Seite HTML Zeichensatz
- Nächste Seite HTML ASCII
Um HTML-Seiten korrekt anzuzeigen, muss der Browser die zu verwendende Zeichensatzkombination (Codierung) kennen:
Beispiel
<meta charset="UTF-8">
HTML Zeichensatz
Der HTML5-Standard ermutigt Web-Entwickler, die Zeichensatzkombination UTF-8 zu verwenden!
Das war jedoch nicht immer so. Die frühe Web-Zeichencodierung war ASCII.
Später, von HTML 2.0 bis HTML 4.01, wurde ISO-8859-1 als Standardzeichensatzkombination betrachtet.
Mit XML und HTML5 ist UTF-8 endlich aufgetaucht und hat viele Probleme der Zeichencodierung gelöst.
Zunächst: ASCII
Computerdaten werden in elektronischen Geräten als Binärcode (01000101) gespeichert.
Um die Standardisierung der Textspeicherung zu erreichen, wurde der American Standard Code for Information Interchange (ASCII) geschaffen. Er definiert für jeden speicherbaren Zeichen einen eindeutigen binären Wert, um Ziffern von 0 bis 9, Groß- und Kleinbuchstaben (a-z, A-Z) sowie Sonderzeichen (wie ! $ + - ( ) @ < > ,) zu unterstützen.
Da ASCII 7-Bit-Zeichen verwendet, kann er nur 128 verschiedene Zeichen darstellen.
Der größte Nachteil von ASCII ist, dass er nicht-englische Buchstaben ausschließt.
Heutzutage wird ASCII immer noch verwendet, insbesondere in großen Hostcomputersystemen.
Für eine tiefere Erforschung besuchen Sie bitte unsere Vollständige Referenz für ASCII.
In Windows: Windows-1252
Windows-1252 ist die Standardzeichensatzkombination in Windows (bis Windows 95).
Es ist eine Erweiterung von ASCII und enthält internationale Zeichen.
Er verwendet einen vollständigen Byte (8 Bit), um 256 verschiedene Zeichen darzustellen.
Da Windows-1252 die Standardkonfiguration in Windows ist, wird es von allen Browsern unterstützt.
Für eine tiefere Erforschung besuchen Sie bitte unsere Vollständige Referenz für Windows-1252.
In HTML 4: ISO-8859-1
Die häufigste Zeichensatzkombination in HTML 4 ist ISO-8859-1.
ISO-8859-1 ist eine Erweiterung von ASCII und enthält internationale Zeichen.
Beispiel
<meta http-equiv="Content-Type" content="text/html;charset=ISO-8859-1">
In HTML 4 kann man im <meta>-Tag einen anderen Zeichensatz als ISO-8859-1 angeben:
Beispiel
<meta http-equiv="Content-Type" content="text/html;charset=ISO-8859-8">
Alle HTML 4-Processor unterstützen ebenfalls UTF-8:
Beispiel
<meta http-equiv="Content-Type" content="text/html;charset=UTF-8">
Tipp:Wenn der Browser ISO-8859-1 erkennt, wird es normalerweise auf Windows-1252 geändert, da Windows-1252 noch 32 internationale Zeichen hat.
Für eine tiefere Erforschung besuchen Sie bitte unsere Vollständige ISO-8859-1 Referenz.
In HTML5: Unicode UTF-8
Der HTML5-Standard ermutigt Web-Entwickler, den Zeichensatz UTF-8 zu verwenden.
Beispiel
<meta charset="UTF-8">
Man kann im <meta>-Tag einen Zeichensatz angeben, der von UTF-8 abweicht:
Beispiel
<meta charset="ISO-8859-1">
Die Unicode-Allianz hat die Standards UTF-8 und UTF-16 entwickelt, da der Zeichensatz ISO-8859 begrenzt ist und nicht mit multilingualen Umgebungen kompatibel ist.
Die Unicode-Standard (fast) umfasst alle Zeichen, Satzzeichen und Symbole der Welt.
Tipp:Alle HTML5- und XML-Processor unterstützen UTF-8, UTF-16, Windows-1252 und ISO-8859.
Für eine tiefere Erforschung besuchen Sie bitte unsere Vollständige Unicode Referenz.
- Vorherige Seite HTML Zeichensatz
- Nächste Seite HTML ASCII