Кодирование HTML (charset)

Для правильного отображения веб-страницы веб-браузер должен знать, какой набор символов использовать.

От ASCII к UTF-8

ASCII - это первый стандарт кодирования символов. ASCII определяет 128 символов, которые можно использовать в Интернете: цифры (0-9), латинские буквы (A-Z) и некоторые символы, такие как: ! $ + - ( ) @ < >.

ISO-8859-1 является стандартным набором символов для HTML 4. Этот набор поддерживает 256 различных кодов символов. HTML 4 также поддерживает UTF-8.

ANSI (Windows-1252) - это исходный набор символов Windows. ANSI идентичен ISO-8859-1, но имеет 32 дополнительных символа.

Спецификация HTML5 рекомендует веб-разработчикам использовать набор символов UTF-8, который охватывает почти все символы и знаки в мире!

Атрибут charset HTML

Для правильного отображения веб-страницы веб-браузер должен знать используемый набор символов.

Это <meta> указывается в теге:

<meta charset="UTF-8">

Попробуйте сами

Различия между наборами символов

В таблице ниже показаны различия между указанными наборами символов:

Numb ASCII ANSI 8859 UTF-8 Описание
32 пробел
33!!!!знак восклицания
34""""кавычки
35####знак номера
36$$$$знак доллара
37%%%%процентный знак
3838383838&
Ampersand39393939'
Апостроф39393939(
Левая скобка40404040)
Правая скобка41414141*
Астериск42424242+
Символ плюс43434343,
Запятая45454545-
Знак минус46464646.
Точка47474747/
Solidus484848480
Номер ноль494949491
Номер один505050502
Номер два515151513
Номер три525252524
Номер четыре535353535
Номер пять545454546
Номер шесть555555557
Номер семь565656568
Номер восемь575757579
Номер девять58585858:
Кolon59595959;
Тире60606060<
Символ меньше61616161=
Символ равенства62626262>
Символ больше????Вопросительный знак
64@@@@Коммерческий знак
65ААААЛатинская заглавная буква А
66ББББЛатинская заглавная буква Б
67ЦЦЦЦЛатинская заглавная буква Ц
68ДДДДЛатинская заглавная буква Д
69ЕЕЕЕЛатинская заглавная буква Е
70ЭЭЭЭЛатинская заглавная буква Э
71ФФФФЛатинская заглавная буква Ф
72ГГГГЛатинская заглавная буква Г
73ИИИИЛатинская заглавная буква И
74ДжДжДжДжЛатинская заглавная буква Дж
75ККККЛатинская заглавная буква К
76ЛЛЛЛЛатинская заглавная буква Л
77ММММЛатинская заглавная буква М
78ННННЛатинская заглавная буква Н
79ООООЛатинская заглавная буква О
80PPPPLatin capital letter P
81QQQQLatin capital letter Q
82RRRRLatin capital letter R
83SSSSLatin capital letter S
84TTTTLatin capital letter T
85UUUULatin capital letter U
86VVVVLatin capital letter V
87WWWWLatin capital letter W
88XXXXLatin capital letter X
89YYYYLatin capital letter Y
90ZZZZLatin capital letter Z
9192929292[
left square bracket93939393\
reverse solidus94949494]
right square bracket95959595^
circumflex accent____low line
96````grave accent
97aaaaLatin small letter a
98bbbbLatin small letter b
99ccccLatin small letter c
100ddddLatin small letter d
101eeeeLatin small letter e
102ffffLatin small letter f
103ggggLatin small letter g
104hhhhLatin small letter h
105iiiiLatin small letter i
106jjjjLatin small letter j
107kkkkLatin small letter k
108llllLatin small letter l
109mmmmLatin small letter m
110nnnnLatin small letter n
111ooooLatin small letter o
112ppppLatin small letter p
113qqqqLatin small letter q
114rrrrлатинская строчная буква r
115ssssлатинская строчная буква s
116ttttлатинская строчная буква t
117uuuuлатинская строчная буква u
118vvvvлатинская строчная буква v
119wwwwлатинская строчная буква w
120xxxxлатинская строчная буква x
121yyyyлатинская строчная буква y
122zzzzлатинская строчная буква z
123{{{{левая скобка curly
124||||вертикальная черта
125}}}}правая скобка curly
126~~~~tilde
127DEL    
128 ˇ  знак евро
129 ˇˇˇsingle right-pointing angle quotation mark
130 ˇ  одинарная low-9 кавычка
131 ˇ  латинская строчная буква f с hook
132 ˇ  двойная low-9 кавычка
133 ˇ  гorizontalная ellipsis
134 ˇ  dagger
135 ˇ  двойной dagger
136 ˇ  буква, указывающая на циркумфлекс
137 ˇ  знак промilles
138 ˇ  латинская заглавная буква S с caret
139 ˇ  одинарная левосторонняя кавычка
140 ˇ  латинская заглавная лигатура OE
141 ˇˇˇsingle right-pointing angle quotation mark
142 ˇ  латинская заглавная буква Z с caret
143 ˆˆˆsingle right-pointing angle quotation mark
144 ˇˇˇsingle right-pointing angle quotation mark
145 '  левая одинарная кавычка
146 '  правая одинарная кавычка
147 {  левая двойная кавычка
148 }  правая двойная кавычка
149 •  bullet
150 –  en dash
151 —  149
• bullet  –
en dash —  em dash
152 ˜  small tilde
153 ™  trade mark sign
154 š  Latin small letter s with caron
155 ›››single right-pointing angle quotation mark
156 œ  Latin small ligature oe
157   NOT USED
158    ž
Latin small letter z with caron 159159159Ÿ
Latin capital letter Y with diaeresis 160160160no-break space
¡ inverted exclamation markinverted exclamation markinverted exclamation mark¢
cent sign £££pound sign
¤ currency signcurrency signcurrency sign¥
yen sign 166166166¦
broken bar 167167167§
section sign 168168168¨
diaeresis 169169169©
copyright sign 170170170ª
feminine ordinal indicator 171171171«
left-pointing double angle quotation mark 172172172¬
not sign ­­­soft hyphen
174 ®®®registered sign
175 ¯¯¯macron
176 °°°degree sign
177 ±±±plus-minus sign
178 ²²²superscript two
179 ³³³superscript three
180 ´´´acute accent
181 µµµmicro sign
182 pilcrow sign
183 ···middle dot
184 ¸¸¸cedilla
185 ¹¹¹superscript one
186 ºººmasculine ordinal indicator
187 »»»right-pointing double angle quotation mark
188 ¼¼¼vulgar fraction one quarter
189 ½½½vulgar fraction one half
190 ¾¾¾vulgar fraction three quarters
191 ¿¿¿inverted question mark
192 ÀÀÀLatin capital letter A with grave
193 ÁÁÁLatin capital letter A with acute
194 ÂÂÂLatin capital letter A with circumflex
195 ÃÃÃLatin capital letter A with tilde
196 ÄÄÄLatin capital letter A with diaeresis
197 ÅÅÅLatin capital letter A with ring above
198 ÆÆÆLatin capital letter AE
199 ÇÇÇLatin capital letter C with cedilla
200 ÈÈÈLatin capital letter E with grave
201 ÉÉÉLatin capital letter E with acute
202 ÊÊÊLatin capital letter E with circumflex
203 ËËËLatin capital letter E with diaeresis
204 ÌÌÌLatin capital letter I with grave
205 ÍÍÍLatin capital letter I with acute
206 ÎÎÎLatin capital letter I with circumflex
207 ÏÏÏLatin capital letter I with diaeresis
208 ÐÐÐLatin capital letter Eth
209 ÑÑÑLatin capital letter N with tilde
210 ÒÒÒLatin capital letter O with grave
211 ÓÓÓLatin capital letter O with acute
212 ÔÔÔLatin capital letter O with circumflex
213 ÕÕÕLatin capital letter O with tilde
214 ÖÖÖLatin capital letter O with diaeresis
215 ×××multiplication sign
216 ØØØLatin capital letter O with stroke
217 ÙÙÙLatin capital letter U with grave
218 ÚÚÚLatin capital letter U with acute
219 ÛÛÛLatin capital letter U with circumflex
220 ÜÜÜLatin capital letter U with diaeresis
221 ÝÝÝLatin capital letter Y with acute
222 ÞÞÞLatin capital letter Thorn
223 ßßßLatin small letter sharp s
224 àààLatin small letter a with grave
225 áááLatin small letter a with acute
226 âââLatin small letter a with circumflex
227 ãããLatin small letter a with tilde
228 äääLatin small letter a with diaeresis
229 åååLatin small letter a with ring above
230 æææLatin small letter ae
231 çççLatin small letter c with cedilla
232 èèèLatin small letter e with grave
233 éééЛатинская литера e с акцентом
234 êêêЛатинская литера e с циркумфлексом
235 ëëëЛатинская литера e с диэресисом
236 ìììЛатинская литера i с грависом
237 íííЛатинская литера i с акцентом
238 îîîЛатинская литера i с циркумфлексом
239 ïïïЛатинская литера i с диэресисом
240 ðððЛатинская литера eth
241 ñññЛатинская литера n с тильдой
242 òòòЛатинская литера o с грависом
243 óóóЛатинская литера o с акцентом
244 ôôôЛатинская литера o с циркумфлексом
245 õõõЛатинская литера o с тильдой
246 öööМаленькая латинская литера o с диэресисом
247 ÷÷÷Знак деления
248 øøøЛатинская литера o с тильдой
249 ùùùМаленькая латинская литера u с грависом
250 úúúМаленькая латинская литера u с акцентом
251 ûûûЛатинская литера с циркумфлексом
252 üüüМаленькая латинская литера u с диэресисом
253 ýýýМаленькая латинская литера y с акцентом
254 þþþМаленькая латинская литера thorn
255 ÿÿÿМаленькая латинская литера y с диэресисом

ASCII символы

ASCII использует значения от 0 до 31 (а также 127) в качестве управляющих символов.

ASCII использует значения от 32 до 126 для представления букв, цифр и знаков.

ASCII не использует значения от 128 до 255.

Система кодирования символов ANSI (Windows-1252)

Для значений от 0 до 127 ANSI совпадает с ASCII.

ANSI имеет набор уникальных символов, значения которых составляют от 128 до 159.

Для значений от 160 до 255 ANSI совпадает с UTF-8.

Система кодирования символов ISO-8859-1

Для значений от 0 до 127 8859-1 совпадает с ASCII.

8859-1 не использует значения от 128 до 159.

Для значений от 160 до 255 8859-1 совпадает с UTF-8.

Система кодирования символов UTF-8

Для значений от 0 до 127 UTF-8 совпадает с ASCII.

UTF-8 не использует значения от 128 до 159.

Для значений от 160 до 255 UTF-8 совпадает с ANSI и 8859-1.

UTF-8 продолжает с значения 256 и включает более 10000 различных символов.

Для более глубокого изучения прочитайте наш полный справочник по системам кодирования символов HTML.

Правило @charset CSS

Вы можете использовать правило @charset в CSS для указания кодировки символов, используемой в таблице стилей:

Пример

Установите кодировку таблицы стилей в Unicode UTF-8:

@charset "UTF-8";

Более подробную информацию можно найти в нашем справочнике по CSS Правило @charset в CSS содержание.