HTML-teckenuppsättning
- Föregående sida HTML-teckenuppsättning
- Nästa sida HTML ASCII
För att korrekt visa HTML-sidor måste webbläsaren veta vilken teckenuppsättning (kodning) som ska användas:
Exempel
<meta charset="UTF-8">
HTML-teckenuppsättning
HTML5-specifikationen uppmuntrar webbutvecklare att använda UTF-8-teckenuppsättningen!
Men inte alltid. Tidig Web:s teckenkodning var ASCII.
Senare, från HTML 2.0 till HTML 4.01, betraktades ISO-8859-1 som standardteckenuppsättning.
Med XML och HTML5 dök UTF-8 till slut upp och löste många teckenkodningsproblem.
Till en början: ASCII
Datordata lagras i elektroniska enheter som binärkod (01000101).
För att standardisera lagring av text skapades American Standard Code for Information Interchange (ASCII). Det definierar en unik binär kod för varje lagrbar tecken för att stödja siffror 0-9, stora och små bokstäver (a-z, A-Z) samt specialtecken (t.ex. ! $ + - ( ) @ < > ,).
Eftersom ASCII använder 7-bits tecken kan det endast representera 128 olika tecken.
ASCII:s största nackdel är att det utesluter icke-engelska bokstäver.
Idag används ASCII fortfarande, särskilt i stora hostdatorsystem.
För mer djupgående forskning, besök vår Komplett referens för ASCII.
I Windows: Windows-1252
Windows-1252 är standardteckenuppsättningen i Windows (tills Windows 95).
Det är en utökning av ASCII, som inkluderar internationella tecken.
Det använder en full byte (8 bitar) för att representera 256 olika tecken.
Eftersom Windows-1252 är standardinställningen i Windows, stöder alla webbläsare det.
För mer djupgående forskning, besök vår Komplett referens för Windows-1252.
I HTML 4: ISO-8859-1
Den mest använda teckenuppsättningen i HTML 4 är ISO-8859-1.
ISO-8859-1 är en utökning av ASCII, som inkluderar internationella tecken.
Exempel
<meta http-equiv="Content-Type" content="text/html;charset=ISO-8859-1">
I HTML 4 kan man specificera en teckenuppsättning annorlunda än ISO-8859-1 i <meta>-taggen:
Exempel
<meta http-equiv="Content-Type" content="text/html;charset=ISO-8859-8">
Alla HTML 4-behandlare stöder också UTF-8:
Exempel
<meta http-equiv="Content-Type" content="text/html;charset=UTF-8">
Tips:När webbläsaren upptäcker ISO-8859-1, används det ofta som standard Windows-1252, eftersom Windows-1252 har ytterligare 32 internationella tecken.
För mer djupgående forskning, besök vår Komplett ISO-8859-1-referens.
I HTML5: Unicode UTF-8
HTML5-standarden uppmuntrar webbutvecklare att använda UTF-8-teckenuppsättningen.
Exempel
<meta charset="UTF-8">
Man kan specificera en teckenuppsättning annorlunda än UTF-8 i <meta>-taggen:
Exempel
<meta charset="ISO-8859-1">
Unicode-unionen har utvecklat UTF-8- och UTF-16-standarder eftersom ISO-8859-teckenuppsättningen är begränsad och inte är kompatibel med flera språksmiljöer.
Unicode-standarden täcker (nästan) alla tecken, punkter och symboler i världen.
Tips:Alla HTML5- och XML-behandlare stöder UTF-8, UTF-16, Windows-1252 och ISO-8859.
För mer djupgående forskning, besök vår Komplett Unicode-referens.
- Föregående sida HTML-teckenuppsättning
- Nästa sida HTML ASCII