Bộ ký tự HTML
- Trang trước Bộ ký tự HTML
- Trang sau ASCII HTML
Để hiển thị chính xác trang HTML, trình duyệt phải biết mã tập tin (mã hóa) cần sử dụng:
Mẫu
<meta charset="UTF-8">
Bộ ký tự HTML
Tiêu chuẩn HTML5 khuyến khích các nhà phát triển Web sử dụng mã tập tin UTF-8!
Tuy nhiên không phải lúc nào cũng như vậy. Mã hóa ký tự của Web đầu tiên là ASCII.
Sau đó, từ HTML 2.0 đến HTML 4.01, ISO-8859-1 được coi là mã tập tin tiêu chuẩn.
Với XML và HTML5, UTF-8 cuối cùng xuất hiện và giải quyết nhiều vấn đề mã hóa ký tự.
Ban đầu: ASCII
Dữ liệu máy tính được lưu trữ dưới dạng mã binary (01000101) trong các thiết bị điện tử.
Để chuẩn hóa lưu trữ văn bản, mã American Standard Code for Information Interchange (ASCII) đã được tạo ra. Nó định nghĩa một số binary duy nhất cho mỗi ký tự có thể lưu trữ, hỗ trợ số từ 0-9, chữ cái in hoa và in thường (a-z, A-Z) và ký tự đặc biệt (ví dụ như ! $ + - ( ) @ < > ,).
Do ASCII sử dụng 7 bit ký tự, vì vậy nó chỉ có thể biểu thị 128 ký tự khác nhau.
Nhược điểm lớn nhất của ASCII là nó loại bỏ các ký tự không phải là chữ cái tiếng Anh.
Ngày nay, ASCII vẫn được sử dụng, đặc biệt là trong các hệ thống máy tính lớn.
Nếu cần nghiên cứu sâu hơn, hãy truy cập Tham khảo hoàn chỉnh ASCII。
Trong Windows: Windows-1252
Windows-1252 là mã tập tin mặc định trong Windows (cho đến Windows 95).
Nó là mở rộng của ASCII, tăng cường các ký tự quốc tế.
Nó sử dụng một byte đầy đủ (8 bit) để biểu thị 256 ký tự khác nhau.
Do Windows-1252 là thiết lập mặc định trong Windows, vì vậy tất cả các trình duyệt đều hỗ trợ nó.
Nếu cần nghiên cứu sâu hơn, hãy truy cập Tham khảo hoàn chỉnh Windows-1252。
Trong HTML 4: ISO-8859-1
Mã tập tin phổ biến nhất trong HTML 4 là ISO-8859-1.
ISO-8859-1 là mở rộng của ASCII, tăng cường các ký tự quốc tế.
Mẫu
<meta http-equiv="Content-Type" content="text/html;charset=ISO-8859-1">
Trong HTML 4, bạn có thể chỉ định bộ ký tự khác với ISO-8859-1 trong thẻ <meta>:
Mẫu
<meta http-equiv="Content-Type" content="text/html;charset=ISO-8859-8">
Tất cả các trình xử lý HTML 4 cũng hỗ trợ UTF-8:
Mẫu
<meta http-equiv="Content-Type" content="text/html;charset=UTF-8">
Lưu ý:Khi trình duyệt phát hiện được ISO-8859-1, nó thường mặc định là Windows-1252 vì Windows-1252 còn 32 ký tự quốc tế.
Nếu cần nghiên cứu sâu hơn, hãy truy cập Tài liệu tham khảo đầy đủ ISO-8859-1。
Trong HTML5: Unicode UTF-8
Tiêu chuẩn HTML5 khuyến khích các nhà phát triển web sử dụng bộ ký tự UTF-8.
Mẫu
<meta charset="UTF-8">
Bạn có thể chỉ định bộ ký tự khác不同于 UTF-8 trong thẻ <meta>:
Mẫu
<meta charset="ISO-8859-1">
Liên minh Unicode đã phát triển các tiêu chuẩn UTF-8 và UTF-16 vì bộ ký tự ISO-8859 bị giới hạn và không tương thích với môi trường đa ngôn ngữ.
Tiêu chuẩn Unicode (gần như) bao gồm tất cả các ký tự, dấu và biểu tượng trên thế giới.
Lưu ý:Tất cả các trình xử lý HTML5 và XML đều hỗ trợ UTF-8, UTF-16, Windows-1252 và ISO-8859.
Nếu cần nghiên cứu sâu hơn, hãy truy cập Tài liệu tham khảo Unicode đầy đủ。
- Trang trước Bộ ký tự HTML
- Trang sau ASCII HTML