Zestaw znaków HTML
- Poprzednia strona Zestaw znaków HTML
- Następna strona HTML ASCII
Aby poprawnie wyświetlić stronę HTML, przeglądarka musi wiedzieć, który zestaw znaków (kodowanie) ma używać:
Przykład
<meta charset="UTF-8">
Zestaw znaków HTML
Specyfikacja HTML5 zachęca deweloperów do używania zestawu znaków UTF-8!
Jednak nie zawsze tak było. Wczesna Web miała kodowanie znaków ASCII.
Później, od HTML 2.0 do HTML 4.01, ISO-8859-1 była uznawana za standardowy zestaw znaków.
Z XML i HTML5, UTF-8 w końcu pojawił się i rozwiązał wiele problemów z kodowaniem znaków.
Początkowo: ASCII
Dane komputerowe są przechowywane w elektronicznych urządzeniach w postaci kodów binarnych (01000101).
Aby standaryzować przechowywanie tekstu, stworzono American Standard Code for Information Interchange (ASCII). Definiuje on unikalny binarny kod dla każdego przechowywanego znaku, aby obsługiwać cyfry 0-9, duże i małe litery (a-z, A-Z) oraz znaki specjalne (np. ! $ + - ( ) @ < > ,).
Ponieważ ASCII używa 7-bitowych znaków, może reprezentować tylko 128 różnych znaków.
Największą wadą ASCII jest to, że wyklucza nieangielskie litery.
Dziś, ASCII nadal jest używany, zwłaszcza w systemach komputerowych dużych hostów.
Dla głębszego zrozumienia prosimy odwiedzić naszą Pełna参照ność ASCII.
W Windows: Windows-1252
Windows-1252 jest domyślnym zestawem znaków w Windows (do Windows 95).
Jest rozszerzeniem ASCII, dodającym międzynarodowe znaki.
Używa pełnego bajtu (8 bitów) do reprezentowania 256 różnych znaków.
Ponieważ Windows-1252 jest domyślnym ustawieniem w Windows, wszystkie przeglądarki ją obsługują.
Dla głębszego zrozumienia prosimy odwiedzić naszą Pełna参照ność Windows-1252.
W HTML 4: ISO-8859-1
Najczęściej używany zestaw znaków w HTML 4 to ISO-8859-1.
ISO-8859-1 jest rozszerzeniem ASCII, dodającym międzynarodowe znaki.
Przykład
<meta http-equiv="Content-Type" content="text/html;charset=ISO-8859-1">
W HTML 4 można指定<meta>标签中的字符 set różny od ISO-8859-1:
Przykład
<meta http-equiv="Content-Type" content="text/html;charset=ISO-8859-8">
Wszystkie procesory HTML 4 również obsługują UTF-8:
Przykład
<meta http-equiv="Content-Type" content="text/html;charset=UTF-8">
Wskazówka:Kiedy przeglądarka wykrywa ISO-8859-1, zazwyczaj domyślnie ustawia Windows-1252, ponieważ Windows-1252 ma dodatkowe 32 międzynarodowe znaki.
Dla głębszego zrozumienia prosimy odwiedzić naszą Pełna referencja ISO-8859-1.
W HTML5: Unicode UTF-8
Specyfikacja HTML5 zachęca deweloperów stron internetowych do używania zestawu znaków UTF-8.
Przykład
<meta charset="UTF-8">
Można指定<meta>标签中的字符集不同于UTF-8:
Przykład
<meta charset="ISO-8859-1">
Związek Unicode opracował standardy UTF-8 i UTF-16, ponieważ zestaw znaków ISO-8859 jest ograniczony i nie jest kompatybilny z wielojęzycznymi środowiskami.
Standard Unicode (prawie) obejmuje wszystkie znaki, znaki przestankowe i symbole na świecie.
Wskazówka:Wszystkie procesory HTML5 i XML obsługują UTF-8, UTF-16, Windows-1252 i ISO-8859.
Dla głębszego zrozumienia prosimy odwiedzić naszą Pełna referencja Unicode.
- Poprzednia strona Zestaw znaków HTML
- Następna strona HTML ASCII