HTML字符集

HTML-sivun oikean näyttämisen varmistamiseksi selaimen on tiedettävä käytettävä merkistö (koodaus):

实例

<meta charset="UTF-8">

HTML字符集

HTML5-säännöstö kannustaa web-kehittäjiä käyttämään UTF-8-merkistöä!

Mutta ei aina. Varhaisessa Webissä oli ASCII-merkistö.

Myöhemmin, HTML 2.0:sta HTML 4.01:een asti ISO-8859-1 pidettiin standardimerkistönä.

XML:n ja HTML5:n myötä UTF-8 ilmestyi vihdoin ja ratkaisi monia merkistöongelmia.

Aluksi: ASCII

Tietokoneet tallentavat tietoja elektronisissa laitteissa binäärikoodina (01000101).

Tekstin tallennuksen standardoimiseksi luotiin Yhdysvaltain tietojenvaihtostandardikoodi (American Standard Code for Information Interchange, ASCII), joka määrittelee jokaiselle tallennettavalle merkillä ainutlaatuisen binääriNumeron, jotta se tukee numeroita 0-9, isokirjaimia (a-z, A-Z) ja erikoismerkkejä (esim. ! $ + - ( ) @ < > ,).

Koska ASCII käyttää 7-bittisiä merkkejä, se voi edustaa vain 128 eri merkkiä.

ASCII:n suurin haitta on, että se sulkee pois ei-englanninkieliset kirjaimet.

Nykyään ASCII:ää käytetään edelleen, erityisesti suurissa tietokoneissa.

如需更深入的研究,请访问我们的 Kattava ASCII viittaus

Windowsissa: Windows-1252

Windows-1252 on Windowsin (aina Windows 95 asti) oletusmerkistö.

Se on ASCII:n laajennus, joka lisää kansainvälisiä merkkejä.

Se käyttää täyttä tiettyä merkkiä (8 bittiä) 256 eri merkin edustamiseen.

Koska Windows-1252 on Windowsin oletusasetus, kaikki selaimet tukevat sitä.

如需更深入的研究,请访问我们的 Kattava Windows-1252 viittaus

HTML 4:ssä: ISO-8859-1

HTML 4:ssä käytetyin merkistö on ISO-8859-1.

ISO-8859-1 on laajennus ASCII:lle, joka lisää kansainvälisiä merkkejä.

实例

<meta http-equiv="Content-Type" content="text/html;charset=ISO-8859-1">

在HTML 4中,可以在<meta>标签中指定与ISO-8859-1不同的字符集:

实例

<meta http-equiv="Content-Type" content="text/html;charset=ISO-8859-8">

所有HTML 4处理器也都支持UTF-8:

实例

<meta http-equiv="Content-Type" content="text/html;charset=UTF-8">

提示:当浏览器检测到ISO-8859-1时,它通常默认为Windows-1252,因为Windows-1252还有32个国际字符。

如需更深入的研究,请访问我们的 完整的ISO-8859-1参考

在HTML5中:Unicode UTF-8

HTML5规范鼓励Web开发人员使用UTF-8字符集。

实例

<meta charset="UTF-8">

可以在<meta>标签中指定不同于UTF-8的字符集:

实例

<meta charset="ISO-8859-1">

Unicode联盟开发了UTF-8和UTF-16标准,因为ISO-8859字符集是受限制的,并且不兼容多语言环境。

Unicode标准(几乎)涵盖了世界上所有的字符、标点和符号。

提示:所有HTML5和XML处理器都支持UTF-8、UTF-16、Windows-1252和ISO-8859。

如需更深入的研究,请访问我们的 完整的Unicode参考