کدگذاری HTML (مجموعهی کاراکترها)
- صفحه قبل علامتهای صورت HTML
- صفحه بعدی URL HTML
توصیههای دوره
برای نمایش صحیح صفحات HTML، مرورگر وب باید مجموعه کاراکتری مورد استفاده را بداند.
از ASCII به UTF-8
ISO-8859-1 مجموعه کاراکتری پیشفرض HTML 4 است. این مجموعه کاراکتری 256 کد کاراکتری مختلف را پشتیبانی میکند. HTML 4 همچنین UTF-8 را پشتیبانی میکند.
ANSI (Windows-1252) مجموعه کاراکتری اصلی ویندوز است. ANSI با ISO-8859-1 مشابه است، اما دارای 32 کاراکتر اضافی است.
مستند HTML5 از توسعهدهندگان وب برای استفاده از مجموعه کاراکتری UTF-8 تشویق میکند، این مجموعه کاراکتری تقریباً همه کاراکترها و علائم جهان را شامل میشود!
خصوصیت charset HTML
برای نمایش صحیح صفحات HTML، مرورگر وب باید مجموعه کاراکتری مورد استفاده در صفحه را بشناسد.
این <meta>
در این
<meta charset="UTF-8">
تفاوت بین مجموعههای کاراکتری
جدول زیر تفاوت بین این مجموعههای کاراکتری را نشان میدهد:
Numb | ASCII | ANSI | 8859 | UTF-8 | توضیحات |
---|---|---|---|---|---|
32 | فضاه | ||||
33 | ! | ! | ! | ! | علامت تعجب |
34 | " | " | " | " | علامت نقل قول |
35 | # | # | # | # | علامت عدد |
36 | $ | $ | $ | $ | علامت دلار |
37 | % | % | % | % | علامت درصد |
38 | & | & | & | & | ampersand |
39 | ' | ' | ' | ' | apostrophe |
40 | ( | ( | ( | ( | left parenthesis |
41 | ) | ) | ) | ) | right parenthesis |
42 | 38 | 38 | 38 | 38 | & |
علامت اینتروایس | ' | ' | ' | ' | علامت علامت نقل قول |
( | علامت قفل چپ | علامت قفل چپ | علامت قفل چپ | علامت قفل چپ | ) |
علامت قفل راست | * | * | * | * | علامت ستاره |
+ | علامت جمع | علامت جمع | علامت جمع | علامت جمع | , |
علامت ویرگول | - | - | - | - | علامت منفی |
. | علامت نقطه | علامت نقطه | علامت نقطه | علامت نقطه | / |
علامت تنوع | 48 | 48 | 48 | 48 | 0 |
عدد صفر | 49 | 49 | 49 | 49 | 1 |
عدد یک | 50 | 50 | 50 | 50 | 2 |
عدد دو | 51 | 51 | 51 | 51 | 3 |
عدد سه | 52 | 52 | 52 | 52 | 4 |
عدد چهار | 53 | 53 | 53 | 53 | 5 |
عدد پنج | 54 | 54 | 54 | 54 | 6 |
عدد شش | 55 | 55 | 55 | 55 | 7 |
عدد هفت | 56 | 56 | 56 | 56 | 8 |
عدد هشت | 57 | 57 | 57 | 57 | 9 |
عدد نه | 58 | 58 | 58 | 58 | : |
علامت دوپونت | ; | ; | ; | ; | علامت ترک حرف |
60 | < | < | < | < | علامت کوچکتر از |
= | علامت برابر با | علامت برابر با | علامت برابر با | علامت برابر با | > |
علامت بزرگتر از | ? | ? | ? | ? | علامت سوالی |
64 | @ | @ | @ | @ | اتم تجاری |
65 | آ | آ | آ | آ | حرف بزرگ لاتین آ |
66 | بی | بی | بی | بی | حرف بزرگ لاتین بی |
67 | سی | سی | سی | سی | حرف بزرگ لاتین سی |
68 | دی | دی | دی | دی | حرف بزرگ لاتین دی |
69 | ای | ای | ای | ای | حرف بزرگ لاتین ای |
70 | ف | ف | ف | ف | حرف بزرگ لاتین ف |
71 | گ | گ | گ | گ | حرف بزرگ لاتین گ |
72 | ه | ه | ه | ه | حرف بزرگ لاتین ه |
73 | ای | ای | ای | ای | حرف بزرگ لاتین ای |
74 | ج | ج | ج | ج | حرف بزرگ لاتین ج |
75 | ک | ک | ک | ک | حرف بزرگ لاتین ک |
76 | ال | ال | ال | ال | حرف بزرگ لاتین ال |
77 | ایم | ایم | ایم | ایم | حرف بزرگ لاتین ایم |
78 | این | این | این | این | حرف بزرگ لاتین این |
79 | او | او | او | او | حرف بزرگ لاتین او |
102 | 80 | 80 | 80 | 80 | P |
Latin capital letter P | 81 | 81 | 81 | 81 | Q |
Latin capital letter Q | 82 | 82 | 82 | 82 | R |
Latin capital letter R | 83 | 83 | 83 | 83 | S |
Latin capital letter S | 84 | 84 | 84 | 84 | T |
Latin capital letter T | 85 | 85 | 85 | 85 | U |
Latin capital letter U | 86 | 86 | 86 | 86 | V |
Latin capital letter V | 87 | 87 | 87 | 87 | W |
Latin capital letter W | 88 | 88 | 88 | 88 | X |
Latin capital letter X | 89 | 89 | 89 | 89 | Y |
Latin capital letter Y | 90 | 90 | 90 | 90 | Z |
Latin capital letter Z | 91 | 91 | 91 | 91 | [ |
left square bracket | 92 | 92 | 92 | 92 | \ |
reverse solidus | 93 | 93 | 93 | 93 | ] |
right square bracket | 95 | 95 | 95 | 95 | ^ |
circumflex accent | _ | _ | _ | _ | low line |
96 | ` | ` | ` | ` | grave accent |
97 | a | a | a | a | Latin small letter a |
98 | b | b | b | b | Latin small letter b |
99 | c | c | c | c | Latin small letter c |
100 | d | d | d | d | Latin small letter d |
101 | e | e | e | e | Latin small letter e |
102 | f | f | f | f | Latin small letter f |
103 | g | g | g | g | Latin small letter g |
104 | h | h | h | h | Latin small letter h |
105 | i | i | i | i | Latin small letter i |
106 | j | j | j | j | Latin small letter j |
107 | k | k | k | k | Latin small letter k |
108 | l | l | l | l | Latin small letter l |
109 | m | m | m | m | Latin small letter m |
110 | n | n | n | n | Latin small letter n |
111 | o | o | o | o | Latin small letter o |
112 | p | p | p | p | Latin small letter p |
113 | q | q | q | q | Latin small letter q |
۱۱۴ | r | r | r | r | Latin small letter r |
۱۱۵ | s | s | s | s | Latin small letter s |
۱۱۶ | t | t | t | t | Latin small letter t |
۱۱۷ | u | u | u | u | Latin small letter u |
۱۱۸ | v | v | v | v | Latin small letter v |
۱۱۹ | w | w | w | w | Latin small letter w |
۱۲۰ | x | x | x | x | Latin small letter x |
۱۲۱ | y | y | y | y | Latin small letter y |
۱۲۲ | z | z | z | z | Latin small letter z |
۱۲۳ | { | { | { | { | left curly bracket |
۱۲۴ | | | | | | | | | vertical line |
۱۲۵ | } | } | } | } | right curly bracket |
۱۲۶ | ~ | ~ | ~ | ~ | tilde |
۱۲۷ | DEL | ||||
۱۲۸ | | euro sign | |||
۱۲۹ | | | | | |
۱۳۰ | | single low-9 quotation mark | |||
۱۳۱ | | Latin small letter f with hook | |||
۱۳۲ | | double low-9 quotation mark | |||
۱۳۳ | horizontal ellipsis | ||||
۱۳۴ | | dagger | |||
۱۳۵ | | double dagger | |||
۱۳۶ | | modifier letter circumflex accent | |||
۱۳۷ | | per mille sign | |||
۱۳۸ | | Latin capital letter S with caron | |||
۱۳۹ | | single left-pointing angle quotation mark | |||
۱۴۰ | | Latin capital ligature OE | |||
۱۴۱ | | | | | |
۱۴۲ | | Latin capital letter Z with caron | |||
۱۴۳ | | | | | |
۱۴۴ | | | | | |
۱۴۵ | | left single quotation mark | |||
۱۴۶ | | right single quotation mark | |||
۱۴۷ | | left double quotation mark | |||
۱۴۸ | | right double quotation mark | |||
149 | | ۱۴۹ | |||
| نشان نقاط | ۱۵۰ | |||
| علامت ان | | |||
علامت امداد | ۱۵۲ | | |||
علامت کوتاه | ۱۵۳ | | |||
نشان تجاری | ۱۵۴ | | |||
نشان حرف کوچک s با کارون | ۱۵۵ | | |||
علامت نقل قول یکپارچه به سمت راست | ۱۵۶ | | |||
نشان اتحاد لاتین کوچک oe | ۱۵۷ | ۱۵۷ | ۱۵۷ | | |
NOT USED | ۱۵۸ | | |||
نشان حرف کوچک ز لاتین با کارون | ۱۵۹ | | |||
نشان حرف بزرگ ی لاتین با دیاکریت | ۱۶۰ | ||||
فضای بدون شکست | ۱۶۱ | ۱۶۱ | ۱۶۱ | ¡ | |
علامت علامت تعجب معکوس | ۱۶۲ | ۱۶۲ | ۱۶۲ | ¢ | |
نشان سنت | ۱۶۳ | ۱۶۳ | ۱۶۳ | £ | |
نشان پوند | ۱۶۴ | ۱۶۴ | ۱۶۴ | ¤ | |
نشان ارز | ۱۶۵ | ۱۶۵ | ۱۶۵ | ¥ | |
نشان یئن | ۱۶۶ | ۱۶۶ | ۱۶۶ | ¦ | |
خط شکسته | ۱۶۷ | ۱۶۷ | ۱۶۷ | § | |
نشان بخش | ۱۶۸ | ۱۶۸ | ۱۶۸ | ¨ | |
نشان دیاکریت | ۱۶۹ | ۱۶۹ | ۱۶۹ | © | |
نشان کپیرایت | ۱۷۰ | ۱۷۰ | ۱۷۰ | ª | |
نشان عددی زنانه | ۱۷۱ | ۱۷۱ | ۱۷۱ | « | |
علامت نقل قول دوگانه به سمت چپ | ۱۷۲ | ۱۷۲ | ۱۷۲ | ¬ | |
نشان غیر | | | | هیphen نرم | |
۱۷۴ | ® | ® | ® | نشان ثبت شده | |
۱۷۵ | ¯ | ¯ | ¯ | مکرون | |
۱۷۶ | ° | ° | ° | نشان درجه | |
۱۷۷ | ± | ± | ± | نشان جمع و تفریق | |
۱۷۸ | ² | ² | ² | ۲ | |
۱۷۹ | ³ | ³ | ³ | ۳ | |
۱۸۰ | ´ | ´ | ´ | افقی | |
۱۸۱ | µ | µ | µ | نشان میکرو | |
۱۸۲ | ¶ | ¶ | ¶ | نشان ستون | |
۱۸۳ | · | · | · | نقطه میانی | |
۱۸۴ | ¸ | ¸ | ¸ | پایینکشیدگی | |
۱۸۵ | ¹ | ¹ | ¹ | ۱ | |
۱۸۶ | º | º | º | نشان عددی مردانه | |
187 | » | » | » | right-pointing double angle quotation mark | |
188 | ¼ | ¼ | ¼ | vulgar fraction one quarter | |
189 | ½ | ½ | ½ | vulgar fraction one half | |
190 | ¾ | ¾ | ¾ | vulgar fraction three quarters | |
191 | ¿ | ¿ | ¿ | inverted question mark | |
192 | À | À | À | Latin capital letter A with grave | |
193 | Á | Á | Á | Latin capital letter A with acute | |
194 | Â | Â | Â | Latin capital letter A with circumflex | |
195 | Ã | Ã | Ã | Latin capital letter A with tilde | |
196 | Ä | Ä | Ä | Latin capital letter A with diaeresis | |
197 | Å | Å | Å | Latin capital letter A with ring above | |
198 | Æ | Æ | Æ | Latin capital letter AE | |
199 | Ç | Ç | Ç | Latin capital letter C with cedilla | |
200 | È | È | È | Latin capital letter E with grave | |
201 | É | É | É | Latin capital letter E with acute | |
202 | Ê | Ê | Ê | Latin capital letter E with circumflex | |
203 | Ë | Ë | Ë | Latin capital letter E with diaeresis | |
204 | Ì | Ì | Ì | Latin capital letter I with grave | |
205 | Í | Í | Í | Latin capital letter I with acute | |
206 | Î | Î | Î | Latin capital letter I with circumflex | |
207 | Ï | Ï | Ï | Latin capital letter I with diaeresis | |
208 | Ð | Ð | Ð | Latin capital letter Eth | |
209 | Ñ | Ñ | Ñ | Latin capital letter N with tilde | |
210 | Ò | Ò | Ò | Latin capital letter O with grave | |
211 | Ó | Ó | Ó | Latin capital letter O with acute | |
212 | Ô | Ô | Ô | Latin capital letter O with circumflex | |
213 | Õ | Õ | Õ | Latin capital letter O with tilde | |
214 | Ö | Ö | Ö | Latin capital letter O with diaeresis | |
215 | × | × | × | multiplication sign | |
216 | Ø | Ø | Ø | Latin capital letter O with stroke | |
217 | Ù | Ù | Ù | Latin capital letter U with grave | |
218 | Ú | Ú | Ú | Latin capital letter U with acute | |
219 | Û | Û | Û | Latin capital letter U with circumflex | |
220 | Ü | Ü | Ü | Latin capital letter U with diaeresis | |
221 | Ý | Ý | Ý | Latin capital letter Y with acute | |
222 | Þ | Þ | Þ | Latin capital letter Thorn | |
223 | ß | ß | ß | Latin small letter sharp s | |
224 | à | à | à | Latin small letter a with grave | |
225 | á | á | á | Latin small letter a with acute | |
226 | â | â | â | Latin small letter a with circumflex | |
227 | ã | ã | ã | Latin small letter a with tilde | |
228 | ä | ä | ä | Latin small letter a with diaeresis | |
229 | å | å | å | Latin small letter a with ring above | |
230 | æ | æ | æ | Latin small letter ae | |
231 | ç | ç | ç | Latin small letter c with cedilla | |
232 | è | è | è | Latin small letter e with grave | |
233 | é | é | é | حرف کوچک لاتین ای با اکوت | |
234 | ê | ê | ê | حرف کوچک لاتین ای با کرونک | |
235 | ë | ë | ë | حرف کوچک لاتین ای با دیاکریتک | |
236 | ì | ì | ì | حرف کوچک لاتین ای با گراو | |
237 | í | í | í | حرف کوچک لاتین ای با اکوت | |
238 | î | î | î | حرف کوچک لاتین ای با کرونک | |
239 | ï | ï | ï | حرف کوچک لاتین ای با دیاکریتک | |
240 | ð | ð | ð | حرف کوچک لاتین ایت | |
241 | ñ | ñ | ñ | حرف کوچک لاتین این با تیلد | |
242 | ò | ò | ò | حرف کوچک لاتین ا با گراو | |
243 | ó | ó | ó | حرف کوچک لاتین ا با اکوت | |
244 | ô | ô | ô | حرف کوچک لاتین ا با کرونک | |
245 | õ | õ | õ | حرف کوچک لاتین ا با تیلد | |
246 | ö | ö | ö | حرف کوچک لاتین ا با دیاکریتک | |
247 | ÷ | ÷ | ÷ | علامت تقسیم | |
248 | ø | ø | ø | حرف کوچک لاتین ا با استرک | |
249 | ù | ù | ù | حرف کوچک لاتین ی با گراو | |
250 | ú | ú | ú | حرف کوچک لاتین ی با اکوت | |
251 | û | û | û | حرف کوچک لاتین با کرونک | |
252 | ü | ü | ü | حرف کوچک لاتین ی با دیاکریتک | |
253 | ý | ý | ý | حرف کوچک لاتین ی با اکوت | |
254 | þ | þ | þ | حرف کوچک لاتین تورن | |
255 | ÿ | ÿ | ÿ | حرف کوچک لاتین ی با دیاکریتک |
مجموعهی کاراکترهای ASCII
ASCII از مقادیر 0 تا 31 (و همچنین 127) به عنوان کاراکترهای کنترل استفاده میکند.
ASCII از ارزشهای بین 32 تا 126 برای نمایش حروف، اعداد و نشانهها استفاده میکند.
ASCII از ارزشهای بین 128 تا 255 استفاده نمیکند.
جلسههای ANSI (Windows-1252)
برای ارزشهای بین 0 تا 127، ANSI با ASCII مشابه است.
ANSI یک مجموعه از کاراکترهای اختصاصی دارد که ارزشهای آن بین 128 تا 159 است.
برای ارزشهای بین 160 تا 255، ANSI با UTF-8 مشابه است.
جلسههای ISO-8859-1
برای ارزشهای بین 0 تا 127، 8859-1 با ASCII مشابه است.
8859-1 از ارزشهای بین 128 تا 159 استفاده نمیکند.
برای ارزشهای بین 160 تا 255، 8859-1 با UTF-8 مشابه است.
جلسههای UTF-8
برای ارزشهای بین 0 تا 127، UTF-8 با ASCII مشابه است.
UTF-8 از ارزشهای بین 12 تا 159 استفاده نمیکند.
برای ارزشهای بین 160 تا 255، UTF-8 با ANSI و 8859-1 مشابه است.
UTF-8 از ارزش 256 ادامه میدهد و شامل بیش از 10000 کاراکتر مختلف است.
برای تحقیقات بیشتر، دستورالعمل کامل جلسههای HTML ما را بخوانید.
قانون @charset CSS
میتوانید از قانون @charset CSS برای مشخص کردن کدگذاری استفاده شده در جدول استایل استفاده کنید:
مثال
کدگذاری جدول استایلها را به Unicode UTF-8 تنظیم کنید:
@charset "UTF-8";
برای اطلاعات بیشتر به دستورالعمل CSS ما مراجعه کنید قانون @charset CSS محتوا.
- صفحه قبل علامتهای صورت HTML
- صفحه بعدی URL HTML