کدگذاری HTML (مجموعه‌ی کاراکترها)

توصیه‌های دوره

برای نمایش صحیح صفحات HTML، مرورگر وب باید مجموعه کاراکتری مورد استفاده را بداند.

از ASCII به UTF-8

ISO-8859-1 مجموعه کاراکتری پیش‌فرض HTML 4 است. این مجموعه کاراکتری 256 کد کاراکتری مختلف را پشتیبانی می‌کند. HTML 4 همچنین UTF-8 را پشتیبانی می‌کند.

ANSI (Windows-1252) مجموعه کاراکتری اصلی ویندوز است. ANSI با ISO-8859-1 مشابه است، اما دارای 32 کاراکتر اضافی است.

مستند HTML5 از توسعه‌دهندگان وب برای استفاده از مجموعه کاراکتری UTF-8 تشویق می‌کند، این مجموعه کاراکتری تقریباً همه کاراکترها و علائم جهان را شامل می‌شود!

خصوصیت charset HTML

برای نمایش صحیح صفحات HTML، مرورگر وب باید مجموعه کاراکتری مورد استفاده در صفحه را بشناسد.

این <meta> در این

<meta charset="UTF-8">

آزمایش کنید

تفاوت بین مجموعه‌های کاراکتری

جدول زیر تفاوت بین این مجموعه‌های کاراکتری را نشان می‌دهد:

Numb ASCII ANSI 8859 UTF-8 توضیحات
32 فضاه
33!!!!علامت تعجب
34""""علامت نقل قول
35####علامت عدد
36$$$$علامت دلار
37%%%%علامت درصد
38&&&&ampersand
39''''apostrophe
40((((left parenthesis
41))))right parenthesis
4238383838&
علامت اینتروایس''''علامت علامت نقل قول
(علامت قفل چپعلامت قفل چپعلامت قفل چپعلامت قفل چپ)
علامت قفل راست****علامت ستاره
+علامت جمععلامت جمععلامت جمععلامت جمع,
علامت ویرگول----علامت منفی
.علامت نقطهعلامت نقطهعلامت نقطهعلامت نقطه/
علامت تنوع484848480
عدد صفر494949491
عدد یک505050502
عدد دو515151513
عدد سه525252524
عدد چهار535353535
عدد پنج545454546
عدد شش555555557
عدد هفت565656568
عدد هشت575757579
عدد نه58585858:
علامت دوپونت;;;;علامت ترک حرف
60<<<<علامت کوچکتر از
=علامت برابر باعلامت برابر باعلامت برابر باعلامت برابر با>
علامت بزرگتر از????علامت سوالی
64@@@@اتم تجاری
65آآآآحرف بزرگ لاتین آ
66بیبیبیبیحرف بزرگ لاتین بی
67سیسیسیسیحرف بزرگ لاتین سی
68دیدیدیدیحرف بزرگ لاتین دی
69ایایایایحرف بزرگ لاتین ای
70ففففحرف بزرگ لاتین ف
71گگگگحرف بزرگ لاتین گ
72ههههحرف بزرگ لاتین ه
73ایایایایحرف بزرگ لاتین ای
74ججججحرف بزرگ لاتین ج
75ککککحرف بزرگ لاتین ک
76الالالالحرف بزرگ لاتین ال
77ایمایمایمایمحرف بزرگ لاتین ایم
78ایناینایناینحرف بزرگ لاتین این
79اواواواوحرف بزرگ لاتین او
10280808080P
Latin capital letter P81818181Q
Latin capital letter Q82828282R
Latin capital letter R83838383S
Latin capital letter S84848484T
Latin capital letter T85858585U
Latin capital letter U86868686V
Latin capital letter V87878787W
Latin capital letter W88888888X
Latin capital letter X89898989Y
Latin capital letter Y90909090Z
Latin capital letter Z91919191[
left square bracket92929292\
reverse solidus93939393]
right square bracket95959595^
circumflex accent____low line
96````grave accent
97aaaaLatin small letter a
98bbbbLatin small letter b
99ccccLatin small letter c
100ddddLatin small letter d
101eeeeLatin small letter e
102ffffLatin small letter f
103ggggLatin small letter g
104hhhhLatin small letter h
105iiiiLatin small letter i
106jjjjLatin small letter j
107kkkkLatin small letter k
108llllLatin small letter l
109mmmmLatin small letter m
110nnnnLatin small letter n
111ooooLatin small letter o
112ppppLatin small letter p
113qqqqLatin small letter q
۱۱۴rrrrLatin small letter r
۱۱۵ssssLatin small letter s
۱۱۶ttttLatin small letter t
۱۱۷uuuuLatin small letter u
۱۱۸vvvvLatin small letter v
۱۱۹wwwwLatin small letter w
۱۲۰xxxxLatin small letter x
۱۲۱yyyyLatin small letter y
۱۲۲zzzzLatin small letter z
۱۲۳{{{{left curly bracket
۱۲۴||||vertical line
۱۲۵}}}}right curly bracket
۱۲۶~~~~tilde
۱۲۷DEL    
۱۲۸ €  euro sign
۱۲۹ 
۱۳۰ ‚  single low-9 quotation mark
۱۳۱ ƒ  Latin small letter f with hook
۱۳۲ „  double low-9 quotation mark
۱۳۳ …  horizontal ellipsis
۱۳۴ †  dagger
۱۳۵ ‡  double dagger
۱۳۶ ˆ  modifier letter circumflex accent
۱۳۷ ‰  per mille sign
۱۳۸ Š  Latin capital letter S with caron
۱۳۹ ‹  single left-pointing angle quotation mark
۱۴۰ Œ  Latin capital ligature OE
۱۴۱ 
۱۴۲ Ž  Latin capital letter Z with caron
۱۴۳ 
۱۴۴ 
۱۴۵ ‘  left single quotation mark
۱۴۶ ’  right single quotation mark
۱۴۷ “  left double quotation mark
۱۴۸ ”  right double quotation mark
149 •  ۱۴۹
• نشان نقاط  ۱۵۰
– علامت ان  —
علامت امداد ۱۵۲  ˜
علامت کوتاه ۱۵۳  ™
نشان تجاری ۱۵۴  š
نشان حرف کوچک s با کارون ۱۵۵  ›
علامت نقل قول یکپارچه به سمت راست ۱۵۶  œ
نشان اتحاد لاتین کوچک oe ۱۵۷۱۵۷۱۵۷
NOT USED ۱۵۸  ž
نشان حرف کوچک ز لاتین با کارون ۱۵۹  Ÿ
نشان حرف بزرگ ی لاتین با دیاکریت    ۱۶۰
فضای بدون شکست ۱۶۱۱۶۱۱۶۱¡
علامت علامت تعجب معکوس ۱۶۲۱۶۲۱۶۲¢
نشان سنت ۱۶۳۱۶۳۱۶۳£
نشان پوند ۱۶۴۱۶۴۱۶۴¤
نشان ارز ۱۶۵۱۶۵۱۶۵¥
نشان یئن ۱۶۶۱۶۶۱۶۶¦
خط شکسته ۱۶۷۱۶۷۱۶۷§
نشان بخش ۱۶۸۱۶۸۱۶۸¨
نشان دیاکریت ۱۶۹۱۶۹۱۶۹©
نشان کپی‌رایت ۱۷۰۱۷۰۱۷۰ª
نشان عددی زنانه ۱۷۱۱۷۱۱۷۱«
علامت نقل قول دوگانه به سمت چپ ۱۷۲۱۷۲۱۷۲¬
نشان غیر ­­­هیphen نرم
۱۷۴ ®®®نشان ثبت شده
۱۷۵ ¯¯¯مکرون
۱۷۶ °°°نشان درجه
۱۷۷ ±±±نشان جمع و تفریق
۱۷۸ ²²²۲
۱۷۹ ³³³۳
۱۸۰ ´´´افقی
۱۸۱ µµµنشان میکرو
۱۸۲ نشان ستون
۱۸۳ ···نقطه میانی
۱۸۴ ¸¸¸پایین‌کشیدگی
۱۸۵ ¹¹¹۱
۱۸۶ ºººنشان عددی مردانه
187 »»»right-pointing double angle quotation mark
188 ¼¼¼vulgar fraction one quarter
189 ½½½vulgar fraction one half
190 ¾¾¾vulgar fraction three quarters
191 ¿¿¿inverted question mark
192 ÀÀÀLatin capital letter A with grave
193 ÁÁÁLatin capital letter A with acute
194 ÂÂÂLatin capital letter A with circumflex
195 ÃÃÃLatin capital letter A with tilde
196 ÄÄÄLatin capital letter A with diaeresis
197 ÅÅÅLatin capital letter A with ring above
198 ÆÆÆLatin capital letter AE
199 ÇÇÇLatin capital letter C with cedilla
200 ÈÈÈLatin capital letter E with grave
201 ÉÉÉLatin capital letter E with acute
202 ÊÊÊLatin capital letter E with circumflex
203 ËËËLatin capital letter E with diaeresis
204 ÌÌÌLatin capital letter I with grave
205 ÍÍÍLatin capital letter I with acute
206 ÎÎÎLatin capital letter I with circumflex
207 ÏÏÏLatin capital letter I with diaeresis
208 ÐÐÐLatin capital letter Eth
209 ÑÑÑLatin capital letter N with tilde
210 ÒÒÒLatin capital letter O with grave
211 ÓÓÓLatin capital letter O with acute
212 ÔÔÔLatin capital letter O with circumflex
213 ÕÕÕLatin capital letter O with tilde
214 ÖÖÖLatin capital letter O with diaeresis
215 ×××multiplication sign
216 ØØØLatin capital letter O with stroke
217 ÙÙÙLatin capital letter U with grave
218 ÚÚÚLatin capital letter U with acute
219 ÛÛÛLatin capital letter U with circumflex
220 ÜÜÜLatin capital letter U with diaeresis
221 ÝÝÝLatin capital letter Y with acute
222 ÞÞÞLatin capital letter Thorn
223 ßßßLatin small letter sharp s
224 àààLatin small letter a with grave
225 áááLatin small letter a with acute
226 âââLatin small letter a with circumflex
227 ãããLatin small letter a with tilde
228 äääLatin small letter a with diaeresis
229 åååLatin small letter a with ring above
230 æææLatin small letter ae
231 çççLatin small letter c with cedilla
232 èèèLatin small letter e with grave
233 éééحرف کوچک لاتین ای با اکوت
234 êêêحرف کوچک لاتین ای با کرونک
235 ëëëحرف کوچک لاتین ای با دیاکریتک
236 ìììحرف کوچک لاتین ای با گراو
237 íííحرف کوچک لاتین ای با اکوت
238 îîîحرف کوچک لاتین ای با کرونک
239 ïïïحرف کوچک لاتین ای با دیاکریتک
240 ðððحرف کوچک لاتین ایت
241 ñññحرف کوچک لاتین این با تیلد
242 òòòحرف کوچک لاتین ا با گراو
243 óóóحرف کوچک لاتین ا با اکوت
244 ôôôحرف کوچک لاتین ا با کرونک
245 õõõحرف کوچک لاتین ا با تیلد
246 öööحرف کوچک لاتین ا با دیاکریتک
247 ÷÷÷علامت تقسیم
248 øøøحرف کوچک لاتین ا با استرک
249 ùùùحرف کوچک لاتین ی با گراو
250 úúúحرف کوچک لاتین ی با اکوت
251 ûûûحرف کوچک لاتین با کرونک
252 üüüحرف کوچک لاتین ی با دیاکریتک
253 ýýýحرف کوچک لاتین ی با اکوت
254 þþþحرف کوچک لاتین تورن
255 ÿÿÿحرف کوچک لاتین ی با دیاکریتک

مجموعه‌ی کاراکترهای ASCII

ASCII از مقادیر 0 تا 31 (و همچنین 127) به عنوان کاراکترهای کنترل استفاده می‌کند.

ASCII از ارزش‌های بین 32 تا 126 برای نمایش حروف، اعداد و نشانه‌ها استفاده می‌کند.

ASCII از ارزش‌های بین 128 تا 255 استفاده نمی‌کند.

جلسه‌های ANSI (Windows-1252)

برای ارزش‌های بین 0 تا 127، ANSI با ASCII مشابه است.

ANSI یک مجموعه از کاراکترهای اختصاصی دارد که ارزش‌های آن بین 128 تا 159 است.

برای ارزش‌های بین 160 تا 255، ANSI با UTF-8 مشابه است.

جلسه‌های ISO-8859-1

برای ارزش‌های بین 0 تا 127، 8859-1 با ASCII مشابه است.

8859-1 از ارزش‌های بین 128 تا 159 استفاده نمی‌کند.

برای ارزش‌های بین 160 تا 255، 8859-1 با UTF-8 مشابه است.

جلسه‌های UTF-8

برای ارزش‌های بین 0 تا 127، UTF-8 با ASCII مشابه است.

UTF-8 از ارزش‌های بین 12 تا 159 استفاده نمی‌کند.

برای ارزش‌های بین 160 تا 255، UTF-8 با ANSI و 8859-1 مشابه است.

UTF-8 از ارزش 256 ادامه می‌دهد و شامل بیش از 10000 کاراکتر مختلف است.

برای تحقیقات بیشتر، دستورالعمل کامل جلسه‌های HTML ما را بخوانید.

قانون @charset CSS

می‌توانید از قانون @charset CSS برای مشخص کردن کدگذاری استفاده شده در جدول استایل استفاده کنید:

مثال

کدگذاری جدول استایل‌ها را به Unicode UTF-8 تنظیم کنید:

@charset "UTF-8";

برای اطلاعات بیشتر به دستورالعمل CSS ما مراجعه کنید قانون @charset CSS محتوا.