HTML 字符集

為了正確顯示 HTML 頁面,瀏覽器必須知道要使用的字符集(編碼):

實例

<meta charset="UTF-8">

HTML 字符集

HTML5 規范鼓勵 Web 開發人員使用 UTF-8 字符集!

然而并非一直如此。早期 Web 的字符編碼為 ASCII。

后來,從 HTML 2.0 到 HTML 4.01,ISO-8859-1 被視為標準字符集。

有了 XML 和 HTML5,UTF-8 終于出現并解決了許多字符編碼問題。

最初:ASCII

計算機數據以二進制代碼(01000101)存儲在電子設備中。

為了使文本的存儲標準化,創建了美國信息交換標準碼(American Standard Code for Information Interchange,ASCII)。它為每個可存儲字符定義了一個唯一的二進制數字,以支持 0-9 之間的數字、大寫和小寫字母(a-z,A-Z)以及特殊字符(比如 ! $ + - ( ) @ < > ,)。

由于 ASCII 使用 7 位字符,因此它只能表示 128 個不同的字符。

ASCII 的最大缺點是,它排除了非英文字母。

如今,ASCII 仍在使用,特別是在大型主機計算機系統中。

如需更深入的研究,請訪問我們的 完整 ASCII 參考

在 Windows 中:Windows-1252

Windows-1252 是 Windows(直到 Windows 95)中的默認字符集。

它是 ASCII 的擴展,增加了國際字符。

它使用一個完整的字節(8 位)表示 256 個不同的字符。

由于 Windows-1252 是 Windows 中的默認設置,因此所有瀏覽器都支持它。

如需更深入的研究,請訪問我們的 完整 Windows-1252 參考

在 HTML 4 中:ISO-8859-1

HTML 4 中最常用的字符集是 ISO-8859-1。

ISO-8859-1 是 ASCII 的擴展,增加了國際字符。

實例

<meta http-equiv="Content-Type" content="text/html;charset=ISO-8859-1">

在 HTML 4 中,可以在 <meta> 標簽中指定與 ISO-8859-1 不同的字符集:

實例

<meta http-equiv="Content-Type" content="text/html;charset=ISO-8859-8">

所有 HTML 4 處理器也都支持 UTF-8:

實例

<meta http-equiv="Content-Type" content="text/html;charset=UTF-8">

提示:當瀏覽器檢測到 ISO-8859-1 時,它通常默認為 Windows-1252,因為 Windows-1252 還有 32 個國際字符。

如需更深入的研究,請訪問我們的 完整的 ISO-8859-1 參考

在 HTML5 中:Unicode UTF-8

HTML5 規范鼓勵 Web 開發人員使用 UTF-8 字符集。

實例

<meta charset="UTF-8">

可以在 <meta> 標簽中指定不同于 UTF-8 的字符集:

實例

<meta charset="ISO-8859-1">

Unicode 聯盟開發了 UTF-8 和 UTF-16 標準,因為 ISO-8859 字符集是受限制的,并且不兼容多語言環境。

Unicode 標準(幾乎)涵蓋世界上所有的字符、標點和符號。

提示:所有 HTML5 和 XML 處理器都支持 UTF-8、UTF-16、Windows-1252 和 ISO-8859。

如需更深入的研究,請訪問我們的 完整 Unicode 參考