ປ່ຽນໃນ HTML

为了正确显示 HTML 页面,Web 浏览器必须知道要使用哪个字符集。

从 ASCII 到 UTF-8

ASCII 是第一个字符编码标准。ASCII 定义了 128 种可以在互联网上使用的字符:数字(0-9)、英文字母(A-Z)和一些特殊字符,比如:! $ + - ( ) @ < >。

ISO-8859-1 是 HTML 4 的默认字符集。此字符集支持 256 个不同的字符代码。HTML 4 同时支持 UTF-8。

ANSI(Windows-1252)是原始的 Windows 字符集。 ANSI 与 ISO-8859-1 相同,不同之处在于 ANSI 具有 32 个额外的字符。

HTML5 规范鼓励 Web 开发人员使用 UTF-8 字符集,该字符集涵盖了世界上几乎所有的字符和符号!

HTML charset 属性

为了正确显示 HTML 页面,Web 浏览器必须了解页面中使用的字符集。

这在 <meta> 标签中指定:

<meta charset="UTF-8">

亲自试一试

字符集之间的差异

下表展示了上述字符集之间的区别:

Numb ASCII ANSI 8859 UTF-8 Description
32 space
33!!!!exclamation mark
34""""quotation mark
35####number sign
36$$$$dollar sign
37%%%%percent sign
3838383838&
ການສູນກາງ39393939'
ກະສວຍດ້ານຍິງ((((ກະສວຍດ້ານຍິງ
(ກະສວຍດ້ານຍິງກະສວຍດ້ານຍິງກະສວຍດ້ານຍິງກະສວຍດ້ານຍິງ)
ກະສວຍດ້ານອາຍຸ****ຄຳນັກບັນນາທິພາກ
42++++ອຽງກວດກວນ
43,,,,ຄຳນັກບັນນາທິພາກ
44----ການສາຍການຫຼຸດຫຼຸດ
45....ພາສາຂີ
47////ກະສວຍ
480000ຕອນເກົ່າ
491111ຕອນເກົ່າ
502222ຕອນເກົ່າ
513333ຕອນເກົ່າ
524444ຕອນເກົ່າ
535555ຕອນເກົ່າ
546666ຕອນເກົ່າ
557777ຕອນເກົ່າ
568888ຕອນເກົ່າ
579999ຕອນເກົ່າ
58::::ອຽງກວດກວນ
59;;;;ອຽງຄວາມສະກະ
60<<<<ອຽງລຸກຂວາ
61====ອຽງສະກະສັບ
62>>>>ອຽງກວດກວນ
63????ອຽງປະສົມ
64@@@@ຈູນກະສາຍຄັ້ງທີ່ເຈັດ
65AAAAປົກສະຕິຍີວິນຕັບກະສາຍຄັ້ງທີ່ເອ
66BBBBປົກສະຕິຍີວິນຕັບກະສາຍຄັ້ງທີ່ເບ
67CCCCປົກສະຕິຍີວິນຕັບກະສາຍຄັ້ງທີ່ເຕ
68DDDDປົກສະຕິຍີວິນຕັບກະສາຍຄັ້ງທີ່ເດ
69EEEEປົກສະຕິຍີວິນຕັບກະສາຍຄັ້ງທີ່ເອ
70FFFFປົກສະຕິຍີວິນຕັບກະສາຍຄັ້ງທີ່ເຝ
71GGGGປົກສະຕິຍີວິນຕັບກະສາຍຄັ້ງທີ່ເກ
72HHHHປົກສະຕິຍີວິນຕັບກະສາຍຄັ້ງທີ່ເຮ
73IIIIປົກສະຕິຍີວິນຕັບກະສາຍຄັ້ງທີ່ເຍ
74JJJJປົກສະຕິຍີວິນຕັບກະສາຍຄັ້ງທີ່ເຈ
75KKKKປົກສະຕິຍີວິນຕັບກະສາຍຄັ້ງທີ່ເຄ
76LLLLປົກສະຕິຍີວິນຕັບກະສາຍຄັ້ງທີ່ເພ
77MMMMປົກສະຕິຍີວິນຕັບກະສາຍຄັ້ງທີ່ເມ
78NNNNປົກສະຕິຍີວິນຕັບກະສາຍຄັ້ງທີ່ເຈັດ
79OOOOປົກສະຕິຍີວິນຕັບກະສາຍຄັ້ງທີ່ໜຶ່ງ
8080808080P
Latin capital letter P81818181Q
Latin capital letter Q82828282R
Latin capital letter R83838383S
Latin capital letter S84848484T
Latin capital letter T85858585U
Latin capital letter U86868686V
Latin capital letter V87878787W
Latin capital letter W88888888X
Latin capital letter X89898989Y
Latin capital letter Y90909090Z
Latin capital letter Z91919191[
left square bracket92929292\
reverse solidus93939393]
right square bracket95959595^
circumflex accent____low line
96````grave accent
97aaaaLatin small letter a
98bbbbLatin small letter b
99ccccLatin small letter c
100ddddLatin small letter d
101eeeeLatin small letter e
102ffffLatin small letter f
103ggggLatin small letter g
104hhhhLatin small letter h
105iiiiLatin small letter i
106jjjjLatin small letter j
107kkkkLatin small letter k
108llllLatin small letter l
109mmmmLatin small letter m
110nnnnLatin small letter n
111ooooLatin small letter o
112ppppLatin small letter p
113qqqqLatin small letter q
114114114114114r
Latin small letter r115115115115s
Latin small letter s116116116116t
Latin small letter t117117117117u
Latin small letter u118118118118v
Latin small letter v119119119119w
Latin small letter w120120120120x
Latin small letter x121121121121y
Latin small letter y122122122122z
Latin small letter z123123123123{
left curly bracket||||vertical line
125}}}}right curly bracket
126~~~~tilde
127DEL    
128 €  euro sign
129 single right-pointing angle quotation mark
130 ‚  single low-9 quotation mark
131 ƒ  Latin small letter f with hook
132 „  double low-9 quotation mark
133 …  horizontal ellipsis
134 †  dagger
135 ‡  double dagger
136 ˆ  modifier letter circumflex accent
137 ‰  per mille sign
138 Š  Latin capital letter S with caron
139 ‹  single left-pointing angle quotation mark
140 Œ  Latin capital ligature OE
141 single right-pointing angle quotation mark
142 Ž  ຊາວລາວີອັງກິດນາມີກາມ
143 single right-pointing angle quotation mark
144 single right-pointing angle quotation mark
145 ‘  left single quotation mark
146 ’  right single quotation mark
147 “  left double quotation mark
148 ”  right double quotation mark
149 •  bullet
150 –  en dash
151 not available for translation  149
• bullet  –
en dash —  em dash
152 ˜  small tilde
153 ™  trade mark sign
154 š  Latin small letter s with caron
155 ›››single right-pointing angle quotation mark
156 œ  Latin small ligature oe
157   NOT USED
158    ž
Latin small letter z with caron 159159159Ÿ
Latin capital letter Y with diaeresis 160160160no-break space
¡ inverted exclamation markinverted exclamation markinverted exclamation mark¢
cent sign £££pound sign
¤ currency signcurrency signcurrency sign¥
yen sign 166166166¦
broken bar 167167167§
section sign 168168168¨
diaeresis 169169169©
copyright sign 170170170ª
feminine ordinal indicator 171171171«
left-pointing double angle quotation mark 172172172¬
not sign ­­­soft hyphen
174 ®®®registered sign
175 ¯¯¯macron
176 °°°degree sign
177 ±±±plus-minus sign
178 ²²²superscript two
179 ³³³superscript three
180 ´´´acute accent
181 µµµmicro sign
182 pilcrow sign
183 ···middle dot
184 ¸¸¸cedilla
185 ¹¹¹superscript one
186 ºººmasculine ordinal indicator
187 »»»ການກັບກັນການກັບກັນຄຳສຳຮອງທີ່ສົ່ງຕາມປົກກະຕິ
188 ¼¼¼ການກັບກັນການກັບກັນຄຳສຳຮອງໜຶ່ງສາມາມ
189 ½½½ການກັບກັນການກັບກັນຄຳສຳຮອງເຄິ່ງສາມາມ
190 ¾¾¾ການກັບກັນການກັບກັນຄຳສຳຮອງສາມສາມາມ
191 ¿¿¿ການກັບກັນການກັບກັນຄຳສັງເກດນັບສຳຮອງ
192 ÀÀÀນາວຕິການລະດັບເທຣນຄັກທີ່ມີການຕັດຮູບດັງ
193 ÁÁÁນາວຕິການລະດັບເທຣນຄັກທີ່ມີການຕັດຮູບດັງ
194 ÂÂÂນາວຕິການລະດັບເທຣນຄັກທີ່ມີການສະແດງຫົວສັນ
195 ÃÃÃນາວຕິການລະດັບເທຣນຄັກທີ່ມີຫົວປອດ
196 ÄÄÄນາວຕິການລະດັບເທຣນຄັກທີ່ມີການຕັດສະພາບດັງ
197 ÅÅÅນາວຕິການລະດັບເທຣນຄັກທີ່ມີຫົວປອດ
198 ÆÆÆນາວຕິການລະດັບເທຣນຄັກທີ່ມີຫົວສັນ
199 ÇÇÇນາວຕິການລະດັບເທຣນຄັກທີ່ມີຫົວສັນ
200 ÈÈÈນາວຕິການລະດັບເທຣນຄັກທີ່ມີການຕັດຮູບດັງ
201 ÉÉÉນາວຕິການລະດັບເທຣນຄັກທີ່ມີການຕັດຮູບດັງ
202 ÊÊÊນາວຕິການລະດັບເທຣນຄັກທີ່ມີການສະແດງຫົວສັນ
203 ËËËນາວຕິການລະດັບເທຣນຄັກທີ່ມີການຕັດສະພາບດັງ
204 ÌÌÌນາວຕິການລະດັບເທຣນຄັກທີ່ມີການຕັດຮູບດັງ
205 ÍÍÍນາວຕິການລະດັບເທຣນຄັກທີ່ມີການຕັດຮູບດັງ
206 ÎÎÎນາວຕິການລະດັບເທຣນຄັກທີ່ມີການສະແດງຫົວສັນ
207 ÏÏÏນາວຕິການລະດັບເທຣນຄັກທີ່ມີການຕັດສະພາບດັງ
208 ÐÐÐນາວຕິການລະດັບເທຣນຄັກທີ່ມີຫົວກັບ
209 ÑÑÑນາວຕິການລະດັບເທຣນຄັກທີ່ມີຫົວຮູບປອດ
210 ÒÒÒLatin capital letter O with grave
211 ÓÓÓLatin capital letter O with acute
212 ÔÔÔLatin capital letter O with circumflex
213 ÕÕÕLatin capital letter O with tilde
214 ÖÖÖLatin capital letter O with diaeresis
215 ×××multiplication sign
216 ØØØLatin capital letter O with stroke
217 ÙÙÙLatin capital letter U with grave
218 ÚÚÚLatin capital letter U with acute
219 ÛÛÛLatin capital letter U with circumflex
220 ÜÜÜLatin capital letter U with diaeresis
221 ÝÝÝLatin capital letter Y with acute
222 ÞÞÞLatin capital letter Thorn
223 ßßßLatin small letter sharp s
224 àààLatin small letter a with grave
225 áááLatin small letter a with acute
226 âââLatin small letter a with circumflex
227 ãããLatin small letter a with tilde
228 äääLatin small letter a with diaeresis
229 åååLatin small letter a with ring above
230 æææLatin small letter ae
231 çççLatin small letter c with cedilla
232 èèèLatin small letter e with grave
233 éééLatin small letter e with acute
234 êêêLatin small letter e with circumflex
235 ëëëLatin small letter e with diaeresis
236 ìììLatin small letter i with grave
237 íííLatin small letter i with acute
238 îîîLatin small letter i with circumflex
239 ïïïLatin small letter i with diaeresis
240 ðððLatin small letter eth
241 ñññLatin small letter n with tilde
242 òòòLatin small letter o with grave
243 óóóLatin small letter o with acute
244 ôôôLatin small letter o with circumflex
245 õõõLatin small letter o with tilde
246 öööLatin small letter o with diaeresis
247 ÷÷÷division sign
248 øøøLatin small letter o with stroke
249 ùùùLatin small letter u with grave
250 úúúLatin small letter u with acute
251 ûûûLatin small letter with circumflex
252 üüüLatin small letter u with diaeresis
253 ýýýLatin small letter y with acute
254 þþþLatin small letter thorn
255 ÿÿÿLatin small letter y with diaeresis

ASCII ຈຸດນິຍົມວິທະຍຸ

ASCII ສົນທະນາໃຊ້ຄັນທີ່ຫຼວງຈາກ 0 ຫາ 31 (ແລະ 127) ເພື່ອສະເພາະຄຳສັງການ。

ASCII 使用 32 到 126 的值表示字母、数字和符号。

ASCII 不使用 128 到 255 之间的值。

ANSI 字符集 (Windows-1252)

对于 0 到 127 的值,ANSI 与 ASCII 相同。

ANSI 有一组专有的字符,其值从 128 到 159。

对于 160 到 255 的值,ANSI 与 UTF-8 相同。

ການຄວາມຂອງ ISO-8859-1

ສຳລັບຄັນຈາກ 0 ຫາ 127, 8859-1 ບໍ່ກົງກັນກັບ ASCII.

8859-1 ບໍ່ນໍາໃຊ້ຄັນຈາກ 128 ຫາ 159.

ສຳລັບຄັນຈາກ 160 ຫາ 255, 8859-1 ບໍ່ກົງກັນກັບ UTF-8.

ການຄວາມຂອງ UTF-8

ສຳລັບຄັນຈາກ 0 ຫາ 127, UTF-8 ບໍ່ກົງກັນກັບ ASCII.

UTF-8 ບໍ່ນໍາໃຊ້ຄັນຈາກ 12 8 ຫາ 159.

ສຳລັບຄັນຈາກ 160 ຫາ 255, UTF-8 ບໍ່ນໍາໃຊ້ຄັນຈາກ 128 ຫາ 159.

UTF-8 ຈາກຄັນ 256 ຕໍ່ມາ, ບັນຈຸວິນປະຕິບັດຫລາຍກວ່າ 10000 ວິນປະຕິບັດຕ່າງກັນ.

ສຳລັບການສຶກສາຫນຶ່ງກ່ວາ, ກະລຸນາອ່ານການອະນຸຍາດ HTML 字符集 reference manual.

ກົດລະບຽບ @charset CSS

ທ່ານສາມາດນໍາໃຊ້ກົດລະບຽບ @charset CSS ເພື່ອກຳນົດການຄວາມຂອງການຄັດເລືອກຂອງການຄັດເລືອກການໃຊ້ການຄວາມຂອງແບບການ:

ຄວາມລວມ

ການດັດແປງການຄວາມຂອງແບບການໃຫ້ການໃຊ້ Unicode UTF-8:

@charset "UTF-8";

ບັນດາຂໍ້ມູນຫນຶ່ງກ່ວານີ້, ກະລຸນາຕິດຕາມຂໍ້ມູນໃນການອະນຸຍາດ CSS ຂອງພວກເຮົາ. ກົດລະບຽບ @charset CSS ການຄວາມສົມທົບ