HTML 字符集
- 上一頁 HTML 字符集
- 下一頁 HTML ASCII
為了正確顯示 HTML 頁面,瀏覽器必須知道要使用的字符集(編碼):
實例
<meta charset="UTF-8">
HTML 字符集
HTML5 規范鼓勵 Web 開發人員使用 UTF-8 字符集!
然而并非一直如此。早期 Web 的字符編碼為 ASCII。
后來,從 HTML 2.0 到 HTML 4.01,ISO-8859-1 被視為標準字符集。
有了 XML 和 HTML5,UTF-8 終于出現并解決了許多字符編碼問題。
最初:ASCII
計算機數據以二進制代碼(01000101)存儲在電子設備中。
為了使文本的存儲標準化,創建了美國信息交換標準碼(American Standard Code for Information Interchange,ASCII)。它為每個可存儲字符定義了一個唯一的二進制數字,以支持 0-9 之間的數字、大寫和小寫字母(a-z,A-Z)以及特殊字符(比如 ! $ + - ( ) @ < > ,)。
由于 ASCII 使用 7 位字符,因此它只能表示 128 個不同的字符。
ASCII 的最大缺點是,它排除了非英文字母。
如今,ASCII 仍在使用,特別是在大型主機計算機系統中。
如需更深入的研究,請訪問我們的 完整 ASCII 參考。
在 Windows 中:Windows-1252
Windows-1252 是 Windows(直到 Windows 95)中的默認字符集。
它是 ASCII 的擴展,增加了國際字符。
它使用一個完整的字節(8 位)表示 256 個不同的字符。
由于 Windows-1252 是 Windows 中的默認設置,因此所有瀏覽器都支持它。
如需更深入的研究,請訪問我們的 完整 Windows-1252 參考。
在 HTML 4 中:ISO-8859-1
HTML 4 中最常用的字符集是 ISO-8859-1。
ISO-8859-1 是 ASCII 的擴展,增加了國際字符。
實例
<meta http-equiv="Content-Type" content="text/html;charset=ISO-8859-1">
在 HTML 4 中,可以在 <meta> 標簽中指定與 ISO-8859-1 不同的字符集:
實例
<meta http-equiv="Content-Type" content="text/html;charset=ISO-8859-8">
所有 HTML 4 處理器也都支持 UTF-8:
實例
<meta http-equiv="Content-Type" content="text/html;charset=UTF-8">
提示:當瀏覽器檢測到 ISO-8859-1 時,它通常默認為 Windows-1252,因為 Windows-1252 還有 32 個國際字符。
如需更深入的研究,請訪問我們的 完整的 ISO-8859-1 參考。
在 HTML5 中:Unicode UTF-8
HTML5 規范鼓勵 Web 開發人員使用 UTF-8 字符集。
實例
<meta charset="UTF-8">
可以在 <meta> 標簽中指定不同于 UTF-8 的字符集:
實例
<meta charset="ISO-8859-1">
Unicode 聯盟開發了 UTF-8 和 UTF-16 標準,因為 ISO-8859 字符集是受限制的,并且不兼容多語言環境。
Unicode 標準(幾乎)涵蓋世界上所有的字符、標點和符號。
提示:所有 HTML5 和 XML 處理器都支持 UTF-8、UTF-16、Windows-1252 和 ISO-8859。
如需更深入的研究,請訪問我們的 完整 Unicode 參考。
- 上一頁 HTML 字符集
- 下一頁 HTML ASCII