Mã hóa HTML (bộ ký tự)

Để hiển thị chính xác trang HTML, trình duyệt web phải biết bộ ký tự cần sử dụng.

Từ ASCII đến UTF-8

ASCII là tiêu chuẩn mã ký tự đầu tiên. ASCII định nghĩa 128 ký tự có thể sử dụng trên internet: số (0-9), chữ cái (A-Z) và một số ký tự đặc biệt như: ! $ + - ( ) @ < >.

ISO-8859-1 là bộ ký tự mặc định của HTML 4. Bộ ký tự này hỗ trợ 256 mã ký tự khác nhau. HTML 4 cũng hỗ trợ UTF-8.

ANSI (Windows-1252) là bộ ký tự Windows gốc. ANSI tương đương với ISO-8859-1, nhưng khác nhau ở chỗ ANSI có 32 ký tự bổ sung.

Tiêu chuẩn HTML5 khuyến khích các nhà phát triển web sử dụng bộ ký tự UTF-8, bộ ký tự này bao gồm hầu hết các ký tự và biểu tượng trên thế giới!

Thuộc tính charset của HTML

Để hiển thị chính xác trang HTML, trình duyệt web phải biết bộ ký tự được sử dụng trong trang.

Trong điều này <meta> Định nghĩa trong thẻ:

<meta charset="UTF-8">

Thử trực tiếp

Sự khác biệt giữa các bộ ký tự

Bảng dưới đây hiển thị sự khác biệt giữa các bộ ký tự trên:

Số ASCII ANSI 8859 UTF-8 Mô tả
32 space
33!!!!exclamation mark
34""""quotation mark
35####number sign
36$$$$dollar sign
37%%%%percent sign
mười lămmười sáumười sáumười sáumười sáumười bảy
mười tám38383838&
ampersand39393939'
apostrophe40404040(
left parenthesis41414141)
right parenthesis****asterisk
+plus signplus signplus signplus sign,
comma45454545-
hyphen-minus....full stop
47////solidus
480000digit zero
491111digit one
502222digit two
513333digit three
524444digit four
535555digit five
546666digit six
557777digit seven
568888digit eight
579999digit nine
58::::colon
59;;;;semicolon
60<<<<less-than sign
61====equals sign
62>>>>greater-than sign
63????question mark
64@@@@commercial at
65AAAALatin capital letter A
66BBBBLatin capital letter B
67CCCCLatin capital letter C
68DDDDLatin capital letter D
69EEEELatin capital letter E
70FFFFLatin capital letter F
71GGGGLatin capital letter G
72HHHHLatin capital letter H
73IIIILatin capital letter I
74JJJJLatin capital letter J
75KKKKLatin capital letter K
76LLLLLatin capital letter L
77MMMMLatin capital letter M
78NNNNLatin capital letter N
79OOOOLatin capital letter O
80PPPPLatin capital letter P
81QQQQLatin capital letter Q
82RRRRLatin capital letter R
83SSSSLatin capital letter S
84TTTTLatin capital letter T
85UUUULatin capital letter U
86VVVVLatin capital letter V
87WWWWLatin capital letter W
88XXXXLatin capital letter X
89YYYYLatin capital letter Y
90ZZZZLatin capital letter Z
9192929292[
left square bracket93939393\
reverse solidus94949494]
right square bracket95959595^
circumflex accent____low line
96````grave accent
97aaaaLatin small letter a
98bbbbLatin small letter b
99ccccLatin small letter c
100ddddLatin small letter d
101eeeeLatin small letter e
102ffffLatin small letter f
103ggggLatin small letter g
104hhhhLatin small letter h
105iiiiLatin small letter i
106jjjjLatin small letter j
107kkkkLatin small letter k
108llllLatin small letter l
109mmmmLatin small letter m
110nnnnLatin small letter n
111ooooLatin small letter o
112ppppLatin small letter p
113qqqqLatin small letter q
114rrrrchữ cái Latinh r
115sssschữ cái Latinh s
116ttttchữ cái Latinh t
117uuuuchữ cái Latinh u
118vvvvchữ cái Latinh v
119wwwwchữ cái Latinh w
120xxxxchữ cái Latinh x
121yyyychữ cái Latinh y
122zzzzchữ cái Latinh z
123{{{{dấu ngoặc móc trái
124||||dấu thẳng
125}}}}dấu ngoặc móc phải
126˜˜˜˜dấu tilde
127DEL    
128   dấu euro
129 single right-pointing angle quotation mark
130   dấu ngoặc thấp
131 ˃  dấu f có móc
132   dấu ngoặc kép thấp
133   dấu ba chấm ngang
134 ˆ  dấu lưỡi
135 ˝  dấu song lưỡi
136 ˚  dấu móc trên
137 ˉ  dấu phần trăm
138 ˇ  Chữ cái Latinh S có caron
139 ˌ  dấu ngoặc góc trái
140 ˆ  Chữ kết hợp Latinh OE
141 single right-pointing angle quotation mark
142 œ  Chữ cái Latinh Z có caron
143 single right-pointing angle quotation mark
144 single right-pointing angle quotation mark
145   dấu ngoặc đơn trái
146   dấu ngoặc đơn phải
147 «  dấu ngoặc kép trái
148 »  dấu ngoặc kép phải
149 •  bullet
150 –  en dash
151 —  149
• bullet  –
en dash —  em dash
152 ˜  small tilde
153 ™  trade mark sign
154 š  Latin small letter s with caron
155 ›››single right-pointing angle quotation mark
156 œ  Latin small ligature oe
157   NOT USED
158    ž
Latin small letter z with caron 159159159Ÿ
Latin capital letter Y with diaeresis 160160160no-break space
¡ inverted exclamation markinverted exclamation markinverted exclamation mark¢
cent sign £££pound sign
¤ currency signcurrency signcurrency sign¥
yen sign 166166166¦
broken bar 167167167§
section sign 168168168¨
diaeresis 169169169©
copyright sign 170170170ª
feminine ordinal indicator 171171171«
left-pointing double angle quotation mark 172172172¬
not sign ­­­soft hyphen
174 ®®®registered sign
175 ¯¯¯macron
176 °°°degree sign
177 ±±±plus-minus sign
178 ²²²superscript two
179 ³³³superscript three
180 ´´´acute accent
181 µµµmicro sign
182 pilcrow sign
183 ···middle dot
184 ¸¸¸cedilla
185 ¹¹¹superscript one
186 ºººmasculine ordinal indicator
187 »»»right-pointing double angle quotation mark
188 ¼¼¼vulgar fraction one quarter
189 ½½½vulgar fraction one half
190 ¾¾¾vulgar fraction three quarters
191 ¿¿¿inverted question mark
192 ÀÀÀLatin capital letter A with grave
193 ÁÁÁLatin capital letter A with acute
194 ÂÂÂLatin capital letter A with circumflex
195 ÃÃÃLatin capital letter A with tilde
196 ÄÄÄLatin capital letter A with diaeresis
197 ÅÅÅLatin capital letter A with ring above
198 ÆÆÆLatin capital letter AE
199 ÇÇÇLatin capital letter C with cedilla
200 ÈÈÈLatin capital letter E with grave
201 ÉÉÉLatin capital letter E with acute
202 ÊÊÊLatin capital letter E with circumflex
203 ËËËLatin capital letter E with diaeresis
204 ÌÌÌLatin capital letter I with grave
205 ÍÍÍLatin capital letter I with acute
206 ÎÎÎLatin capital letter I with circumflex
207 ÏÏÏLatin capital letter I with diaeresis
208 ÐÐÐLatin capital letter Eth
209 ÑÑÑLatin capital letter N with tilde
210 ÒÒÒLatin capital letter O with grave
211 ÓÓÓLatin capital letter O with acute
212 ÔÔÔLatin capital letter O with circumflex
213 ÕÕÕLatin capital letter O with tilde
214 ÖÖÖLatin capital letter O with diaeresis
215 ×××multiplication sign
216 ØØØLatin capital letter O with stroke
217 ÙÙÙLatin capital letter U with grave
218 ÚÚÚLatin capital letter U with acute
219 ÛÛÛLatin capital letter U with circumflex
220 ÜÜÜLatin capital letter U with diaeresis
221 ÝÝÝLatin capital letter Y with acute
222 ÞÞÞLatin capital letter Thorn
223 ßßßLatin small letter sharp s
224 àààLatin small letter a with grave
225 áááLatin small letter a with acute
226 âââLatin small letter a with circumflex
227 ãããLatin small letter a with tilde
228 äääLatin small letter a with diaeresis
229 åååLatin small letter a with ring above
230 æææLatin small letter ae
231 çççLatin small letter c with cedilla
232 èèèLatin small letter e with grave
233 éééChữ cái Latin nhỏ e với dấu mũi tên
234 êêêChữ cái Latin nhỏ e với dấu vuông
235 ëëëChữ cái Latin nhỏ e với dấu重音
236 ìììChữ cái Latin nhỏ i với dấu nặng
237 íííChữ cái Latin nhỏ i với dấu mũi tên
238 îîîChữ cái Latin nhỏ i với dấu vuông
239 ïïïChữ cái Latin nhỏ i với dấu重音
240 ðððChữ cái Latin nhỏ eth
241 ñññChữ cái Latin nhỏ n với dấu mũ
242 òòòChữ cái Latin nhỏ o với dấu nặng
243 óóóChữ cái Latin nhỏ o với dấu mũi tên
244 ôôôChữ cái Latin nhỏ o với dấu vuông
245 õõõChữ cái Latin nhỏ o với dấu mũ
246 öööChữ cái Latin nhỏ o với dấu重音
247 ÷÷÷Dấu chia
248 øøøChữ cái Latin nhỏ o với dấu gạch dưới
249 ùùùChữ cái Latin nhỏ u với dấu nặng
250 úúúChữ cái Latin nhỏ u với dấu mũi tên
251 ûûûChữ cái Latin với dấu vuông
252 üüüChữ cái Latin nhỏ u với dấu重音
253 ýýýChữ cái Latin nhỏ y với dấu mũi tên
254 þþþChữ cái Latin nhỏ thorn
255 ÿÿÿChữ cái Latin nhỏ y với dấu重音

Bảng mã ASCII

ASCII sử dụng giá trị từ 0 đến 31 (và 127) để làm ký tự điều khiển.

ASCII sử dụng các giá trị từ 32 đến 126 để biểu thị chữ cái, số và ký hiệu.

ASCII không sử dụng các giá trị từ 128 đến 255.

Bảng mã ANSI (Windows-1252)

Đối với các giá trị từ 0 đến 127, ANSI tương tự như ASCII.

ANSI có một nhóm ký tự đặc biệt, giá trị từ 128 đến 159.

Đối với các giá trị từ 160 đến 255, ANSI tương tự như UTF-8.

Bảng mã ISO-8859-1

Đối với các giá trị từ 0 đến 127, 8859-1 tương tự như ASCII.

8859-1 không sử dụng các giá trị từ 128 đến 159.

Đối với các giá trị từ 160 đến 255, 8859-1 tương tự như UTF-8.

Bảng mã UTF-8

Đối với các giá trị từ 0 đến 127, UTF-8 tương tự như ASCII.

UTF-8 không sử dụng các giá trị từ 128 đến 159.

Đối với các giá trị từ 160 đến 255, UTF-8 tương tự như ANSI và 8859-1.

UTF-8 tiếp tục từ giá trị 256, bao gồm hơn 10000 ký tự khác nhau.

Để tìm hiểu sâu hơn, hãy đọc tài liệu tham khảo đầy đủ về bảng mã ký tự HTML của chúng tôi.

Quy tắc @charset CSS

Bạn có thể sử dụng quy tắc @charset CSS để chỉ định mã hóa ký tự được sử dụng trong bảng phong cách:

Mô hình

Đặt mã hóa bảng樣 của bảng phong cách thành Unicode UTF-8:

@charset "UTF-8";

Hãy tìm hiểu thêm về Ngữ pháp @charset CSS Nội dung.