Zestaw znaków HTML

Aby poprawnie wyświetlić stronę HTML, przeglądarka musi wiedzieć, który zestaw znaków (kodowanie) ma używać:

Przykład

<meta charset="UTF-8">

Zestaw znaków HTML

Specyfikacja HTML5 zachęca deweloperów do używania zestawu znaków UTF-8!

Jednak nie zawsze tak było. Wczesna Web miała kodowanie znaków ASCII.

Później, od HTML 2.0 do HTML 4.01, ISO-8859-1 była uznawana za standardowy zestaw znaków.

Z XML i HTML5, UTF-8 w końcu pojawił się i rozwiązał wiele problemów z kodowaniem znaków.

Początkowo: ASCII

Dane komputerowe są przechowywane w elektronicznych urządzeniach w postaci kodów binarnych (01000101).

Aby standaryzować przechowywanie tekstu, stworzono American Standard Code for Information Interchange (ASCII). Definiuje on unikalny binarny kod dla każdego przechowywanego znaku, aby obsługiwać cyfry 0-9, duże i małe litery (a-z, A-Z) oraz znaki specjalne (np. ! $ + - ( ) @ < > ,).

Ponieważ ASCII używa 7-bitowych znaków, może reprezentować tylko 128 różnych znaków.

Największą wadą ASCII jest to, że wyklucza nieangielskie litery.

Dziś, ASCII nadal jest używany, zwłaszcza w systemach komputerowych dużych hostów.

Dla głębszego zrozumienia prosimy odwiedzić naszą Pełna参照ność ASCII.

W Windows: Windows-1252

Windows-1252 jest domyślnym zestawem znaków w Windows (do Windows 95).

Jest rozszerzeniem ASCII, dodającym międzynarodowe znaki.

Używa pełnego bajtu (8 bitów) do reprezentowania 256 różnych znaków.

Ponieważ Windows-1252 jest domyślnym ustawieniem w Windows, wszystkie przeglądarki ją obsługują.

Dla głębszego zrozumienia prosimy odwiedzić naszą Pełna参照ność Windows-1252.

W HTML 4: ISO-8859-1

Najczęściej używany zestaw znaków w HTML 4 to ISO-8859-1.

ISO-8859-1 jest rozszerzeniem ASCII, dodającym międzynarodowe znaki.

Przykład

<meta http-equiv="Content-Type" content="text/html;charset=ISO-8859-1">

W HTML 4 można指定<meta>标签中的字符 set różny od ISO-8859-1:

Przykład

<meta http-equiv="Content-Type" content="text/html;charset=ISO-8859-8">

Wszystkie procesory HTML 4 również obsługują UTF-8:

Przykład

<meta http-equiv="Content-Type" content="text/html;charset=UTF-8">

Wskazówka:Kiedy przeglądarka wykrywa ISO-8859-1, zazwyczaj domyślnie ustawia Windows-1252, ponieważ Windows-1252 ma dodatkowe 32 międzynarodowe znaki.

Dla głębszego zrozumienia prosimy odwiedzić naszą Pełna referencja ISO-8859-1.

W HTML5: Unicode UTF-8

Specyfikacja HTML5 zachęca deweloperów stron internetowych do używania zestawu znaków UTF-8.

Przykład

<meta charset="UTF-8">

Można指定<meta>标签中的字符集不同于UTF-8:

Przykład

<meta charset="ISO-8859-1">

Związek Unicode opracował standardy UTF-8 i UTF-16, ponieważ zestaw znaków ISO-8859 jest ograniczony i nie jest kompatybilny z wielojęzycznymi środowiskami.

Standard Unicode (prawie) obejmuje wszystkie znaki, znaki przestankowe i symbole na świecie.

Wskazówka:Wszystkie procesory HTML5 i XML obsługują UTF-8, UTF-16, Windows-1252 i ISO-8859.

Dla głębszego zrozumienia prosimy odwiedzić naszą Pełna referencja Unicode.