HTML karakterset
- Vorige pagina HTML karakterset
- Volgende pagina HTML ASCII
Om HTML-pagina's correct weer te geven, moet de browser weten welke tekenset (encoding) te gebruiken:
Voorbeeld
<meta charset="UTF-8">
HTML karakterset
Het HTML5-norm beveelt webontwikkelaars aan om de tekenset UTF-8 te gebruiken!
Maar dat was niet altijd het geval. De tekenset van de vroege web was ASCII.
Later, van HTML 2.0 tot HTML 4.01, werd ISO-8859-1 gezien als de standaard tekenset.
Met XML en HTML5 is UTF-8 eindelijk verschenen en heeft het veel problemen met characterencoding opgelost.
Eerst: ASCII
Computerdata wordt opgeslagen in elektronische apparaten als binaire codes (01000101).
Om de standaardisatie van tekstopslag te bevorderen, is de American Standard Code for Information Interchange (ASCII) gecreëerd. Het definieert een unieke binair getal voor elke opslaanbare teken, om cijfers tussen 0-9, hoofdletters en kleine letters (a-z, A-Z) en speciale tekens (zoals ! $ + - ( ) @ < > ,) te ondersteunen.
Omdat ASCII 7-bits tekens gebruikt, kan het slechts 128 verschillende tekens representeren.
De grootste nadruk van ASCII is dat het niet-Engelse letters uitsluit.
Vandaag de dag wordt ASCII nog steeds gebruikt, vooral in grote hostcomputerssystemen.
Voor verdere studie, bezoek onze Volledige referentie ASCII.
In Windows:
Windows-1252 is de standaard tekenset in Windows (tot Windows 95).
Het is een uitbreiding van ASCII, die internationale tekens toevoegt.
Het gebruikt een volledige byte (8 bits) om 256 verschillende tekens te representeren.
Omdat Windows-1252 de standaard instelling is in Windows, ondersteunen alle browsers het.
Voor verdere studie, bezoek onze Volledige referentie Windows-1252.
In HTML 4:
ISO-8859-1 is de meest gebruikte tekenset in HTML 4.
ISO-8859-1 is een uitbreiding van ASCII, die internationale tekens toevoegt.
Voorbeeld
<meta http-equiv="Content-Type" content="text/html;charset=ISO-8859-1">
In HTML 4 kun je een andere karakterset dan ISO-8859-1 specificeren in de <meta>-tag:
Voorbeeld
<meta http-equiv="Content-Type" content="text/html;charset=ISO-8859-8">
Alle HTML 4 processors ondersteunen ook UTF-8:
Voorbeeld
<meta http-equiv="Content-Type" content="text/html;charset=UTF-8">
Tip:Wanneer de browser ISO-8859-1 detecteert, default hij meestal naar Windows-1252, omdat Windows-1252 nog 32 internationale tekens heeft.
Voor verdere studie, bezoek onze Volledige ISO-8859-1 referentie.
In HTML5: Unicode UTF-8
De HTML5 specificatie moedigt webontwikkelaars aan om de UTF-8 karakterset te gebruiken.
Voorbeeld
<meta charset="UTF-8">
Je kunt een andere karakterset dan UTF-8 specificeren in de <meta>-tag:
Voorbeeld
<meta charset="ISO-8859-1">
De Unicode Alliantie heeft de UTF-8 en UTF-16 standaarden ontwikkeld, omdat de ISO-8859 karakterset beperkt is en niet compatibel is met meertalige omgevingen.
De Unicode standaard (bijna) omvat alle tekens, puncties en symbolen in de wereld.
Tip:Alle HTML5 en XML processors ondersteunen UTF-8, UTF-16, Windows-1252 en ISO-8859.
Voor verdere studie, bezoek onze Volledige Unicode referentie.
- Vorige pagina HTML karakterset
- Volgende pagina HTML ASCII