HTML 字符集

为了正确显示 HTML 页面,浏览器必须知道要使用的字符集(编码):

实例


HTML 字符集

HTML5 规范鼓励 Web 开发人员使用 UTF-8 字符集!

然而并非一直如此。早期 Web 的字符编码为 ASCII。

后来,从 HTML 2.0 到 HTML 4.01,ISO-8859-1 被视为标准字符集。

有了 XML 和 HTML5,UTF-8 终于出现并解决了许多字符编码问题。

最初:ASCII

计算机数据以二进制代码(01000101)存储在电子设备中。

为了使文本的存储标准化,创建了美国信息交换标准码(American Standard Code for Information Interchange,ASCII)。它为每个可存储字符定义了一个唯一的二进制数字,以支持 0-9 之间的数字、大写和小写字母(a-z,A-Z)以及特殊字符(比如 ! $ + - ( ) @ < > ,)。

由于 ASCII 使用 7 位字符,因此它只能表示 128 个不同的字符。

ASCII 的最大缺点是,它排除了非英文字母。

Hivi karibuni, ASCII inatumiwa, hasa kwenye vifaa vya kompyuta kubwa vya mtaani.

如需更深入的研究,请访问我们的 Mwongozo wa ASCII kamilifu

Kwenye Windows: Windows-1252

Windows-1252 ni kichwa cha kawaida kwenye Windows (hadi Windows 95).

Ni kichwa cha ASCII, inaeza kichwa za nchi.

Inatumiwa byte kamili (8 vi) kuonekana kwa 256 kichwa kina.

Kwa sababu Windows-1252 ni mpangilio wa kawaida kwenye Windows, zote wasafiri wengi wameingia kwa kusukumwa.

如需更深入的研究,请访问我们的 Mwongozo wa Windows-1252 kamilifu

Kwenye HTML 4: ISO-8859-1

Kichwa cha kawaida cha HTML 4 ni ISO-8859-1.

ISO-8859-1 niyejia ASCII, inaeza wengia kichwa za nchi.

实例

<meta http-equiv="Content-Type" content="text/html;charset=ISO-8859-1">

在 HTML 4 中,可以在 标签中指定与 ISO-8859-1 不同的字符集:

实例


所有 HTML 4 处理器也都支持 UTF-8:

实例


提示:当浏览器检测到 ISO-8859-1 时,它通常默认为 Windows-1252,因为 Windows-1252 还有 32 个国际字符。

如需更深入的研究,请访问我们的 完整的 ISO-8859-1 参考

在 HTML5 中:Unicode UTF-8

HTML5 规范鼓励 Web 开发人员使用 UTF-8 字符集。

实例


可以在 标签中指定不同于 UTF-8 的字符集:

实例


Unicode 联盟开发了 UTF-8 和 UTF-16 标准,因为 ISO-8859 字符集是受限制的,并且不兼容多语言环境。

Unicode 标准(几乎)涵盖世界上所有的字符、标点和符号。

提示:所有 HTML5 和 XML 处理器都支持 UTF-8、UTF-16、Windows-1252 和 ISO-8859。

如需更深入的研究,请访问我们的 完整 Unicode 参考