HTML-karakter集中的
- Forrige side HTML-karakter集中的
- Næste side HTML ASCII
For at vise HTML-sider korrekt skal browseren vide, hvilket tegnsæt (kodning) der skal bruges:
Eksempel
<meta charset="UTF-8">
HTML-karakter集中的
HTML5-specifikationen opfordrer webudviklere til at bruge UTF-8 tegnsæt!
Men det har ikke altid været sådan. Tidlig web-tegnsætning var ASCII.
Senere, fra HTML 2.0 til HTML 4.01, blev ISO-8859-1 betragtet som standardtegnsæt.
Med XML og HTML5 opstod UTF-8 endelig og løste mange problemer med tegnsætning.
Først: ASCII
Computerdata lagres som binær kode (01000101) i elektroniske enheder.
For at standardisere lagring af tekst blev American Standard Code for Information Interchange (ASCII) oprettet. Det definerer en unik binær tal for hver gemmelig tegn for at støtte tal mellem 0-9, store og små bogstaver (a-z, A-Z) samt specialtegn (f.eks. ! $ + - ( ) @ < > ,).
Da ASCII bruger 7-bit tegn, kan det kun repræsentere 128 forskellige tegn.
ASCII's største ulempe er, at det udelukker ikke-engelske bogstaver.
I dag bruges ASCII stadig, især i store hovedcomputersystemer.
For mere dybdegående forskning, besøg vores Komplet reference til ASCII.
I Windows: Windows-1252
Windows-1252 er standardtegnsæt i Windows (indtil Windows 95).
Det er en udvidelse af ASCII, der tilføjer internationale tegn.
Det bruger en hel byte (8 bit) til at repræsentere 256 forskellige tegn.
Da Windows-1252 er standardindstillingen i Windows, understøtter alle browsere det.
For mere dybdegående forskning, besøg vores Komplet reference til Windows-1252.
I HTML 4: ISO-8859-1
Den mest almindelige tegnsæt i HTML 4 er ISO-8859-1.
ISO-8859-1 er en udvidelse af ASCII, der tilføjer internationale tegn.
Eksempel
<meta http-equiv="Content-Type" content="text/html;charset=ISO-8859-1">
I HTML 4 kan man specificere en anden karakterindhold end ISO-8859-1 i <meta>-tagget:
Eksempel
<meta http-equiv="Content-Type" content="text/html;charset=ISO-8859-8">
Alle HTML 4-processorer understøtter også UTF-8:
Eksempel
<meta http-equiv="Content-Type" content="text/html;charset=UTF-8">
Tip:Når browseren detekterer ISO-8859-1, bruger den normalt Windows-1252 som standard, fordi Windows-1252 har 32 internationale tegn.
For mere dybdegående forskning, besøg vores Komplet ISO-8859-1 Reference.
I HTML5: Unicode UTF-8
HTML5-standarden opfordrer Web-udviklere til at bruge UTF-8-karakterindhold.
Eksempel
<meta charset="UTF-8">
Man kan specificere en anden karakterindhold end UTF-8 i <meta>-tagget:
Eksempel
<meta charset="ISO-8859-1">
Unicode-alliancen har udviklet UTF-8 og UTF-16-standarder, fordi ISO-8859-karakterindholdet er begrænset og ikke kompatibelt med flere sprogmiljøer.
Unicode-standarden (n儿est) dækker alle tegn, punkter og symboler i verden.
Tip:Alle HTML5 og XML-processorer understøtter UTF-8, UTF-16, Windows-1252 og ISO-8859.
For mere dybdegående forskning, besøg vores Komplet Unicode Reference.
- Forrige side HTML-karakter集中的
- Næste side HTML ASCII