HTML এনকোডিং (চারিটি সংকেতসমূহ)
- পূর্ববর্তী পৃষ্ঠা HTML ইমোজি
- পরবর্তী পৃষ্ঠা HTML URL
To display HTML pages correctly, the web browser must know which character set to use.
From ASCII to UTF-8
ASCII প্রথম চার্জেট কোডিং স্ট্যান্ডার্ড। ASCII 128টি ইন্টারনেটে ব্যবহৃত চার্জেটকে নির্দিষ্ট করে: সংখ্যা (0-9), অক্ষর (A-Z) এবং কিছু বিশেষ চার্জেট যেমন: ! $ + - ( ) @ < >
ISO-8859-1 HTML 4-এর ডিফল্ট চার্জেট সেট। এই চার্জেট সেটটি 256টি ভিন্ন চার্জেট কোডকে সমর্থন করে। HTML 4-এর পাশাপাশি UTF-8-ও সমর্থন করা হয়。
ANSI (Windows-1252) হল মৌলিক Windows চার্জেট। ANSI এবং ISO-8859-1 একই, কিন্তু ANSI-তে 32টি অতিরিক্ত চার্জেট আছে。
HTML5 নিয়ামক ওয়েব ডেভেলপারদের UTF-8 চার্জেট সেটটি ব্যবহার করার উৎসাহ দেয়, যেটি বিশ্বের প্রায় সকল চার্জেট ও সিগনকে আছে!
HTML charset 属性
একটি HTML পাতা সঠিকভাবে দেখানোর জন্য, ওয়েব ব্রাউজারকে পাতায় ব্যবহৃত চার্জেট সেটটি জানা উচিত。
এটা <meta>
এই ট্যাগে সূচিত করা হয়:
<meta charset="UTF-8">
চার্জেট সেটের মধ্যে পার্থক্য
এই টেবিলে উপরোক্ত চার্জেট সেটের মধ্যে পার্থক্যকে দেখানো হল:
Numb | ASCII | ANSI | 8859 | UTF-8 | Description |
---|---|---|---|---|---|
32 | space | ||||
33 | ! | ! | ! | ! | exclamation mark |
34 | " | " | " | " | quotation mark |
35 | # | # | # | # | number sign |
36 | $ | $ | $ | $ | dollar sign |
37 | % | % | % | % | percent sign |
38 | ৩৮ | ৩৮ | ৩৮ | ৩৮ | & |
এম্পার্স্যান্ড | ৩৯ | ৩৯ | ৩৯ | ৩৯ | ' |
এপোস্ট্রফ | ৪০ | ৪০ | ৪০ | ৪০ | ( |
লেফ্ট প্যারেনথেসিস | ৪১ | ৪১ | ৪১ | ৪১ | ) |
রাইট প্যারেনথেসিস | ৪২ | ৪২ | ৪২ | ৪২ | * |
এস্টারিস্ক | + | + | + | + | প্লাস সাইন |
৪৪ | , | , | , | , | কমা |
৪৫ | - | - | - | - | হাইপেনমিনাস |
৪৬ | . | . | . | . | ফুল স্টপ |
৪৭ | / | / | / | / | সোলিডাস |
৪৮ | ০ | ০ | ০ | ০ | নম্বর শূন্য |
৪৯ | ১ | ১ | ১ | ১ | নম্বর এক |
৫০ | ২ | ২ | ২ | ২ | নম্বর দ |
৫১ | ৩ | ৩ | ৩ | ৩ | নম্বর ত |
৫২ | ৪ | ৪ | ৪ | ৪ | নম্বর চ |
৫৩ | ৫ | ৫ | ৫ | ৫ | নম্বর প |
৫৪ | ৬ | ৬ | ৬ | ৬ | নম্বর ছ |
৫৫ | ৭ | ৭ | ৭ | ৭ | নম্বর সাত |
৫৬ | ৮ | ৮ | ৮ | ৮ | নম্বর আট |
৫৭ | ৯ | ৯ | ৯ | ৯ | নম্বর নয় |
৫৮ | : | : | : | : | কলন |
৫৯ | ; | ; | ; | ; | সেমিকোলন |
৬০ | < | < | < | < | কম দ্রব্য |
৬১ | = | = | = | = | সমানদ্রব্য |
৬২ | > | > | > | > | সমানদ্রব্য |
৬৩ | ? | ? | ? | ? | প্রশ্নদ্রব্য |
৬৪ | @ | @ | @ | @ | কমার্শিয়াল এট |
৬৫ | এ | এ | এ | এ | ল্যাটিন ক্যাপিটাল লেটার এ |
৬৬ | বি | বি | বি | বি | ল্যাটিন ক্যাপিটাল লেটার বি |
৬৭ | সি | সি | সি | সি | ল্যাটিন ক্যাপিটাল লেটার সি |
৬৮ | ডি | ডি | ডি | ডি | ল্যাটিন ক্যাপিটাল লেটার ডি |
৬৯ | ই | ই | ই | ই | ল্যাটিন ক্যাপিটাল লেটার ই |
৭০ | এফ | এফ | এফ | এফ | ল্যাটিন ক্যাপিটাল লেটার এফ |
৭১ | এগ | এগ | এগ | এগ | ল্যাটিন ক্যাপিটাল লেটার এগ |
৭২ | এই | এই | এই | এই | ল্যাটিন ক্যাপিটাল লেটার এই |
৭৩ | আই | আই | আই | আই | ল্যাটিন ক্যাপিটাল লেটার আই |
৭৪ | জে | জে | জে | জে | ল্যাটিন ক্যাপিটাল লেটার জে |
৭৫ | কে | কে | কে | কে | ল্যাটিন ক্যাপিটাল লেটার কে |
৭৬ | এল | এল | এল | এল | ল্যাটিন ক্যাপিটাল লেটার এল |
৭৭ | এম | এম | এম | এম | ল্যাটিন ক্যাপিটাল লেটার এম |
৭৮ | এন | এন | এন | এন | ল্যাটিন ক্যাপিটাল লেটার এন |
৭৯ | ও | ও | ও | ও | ল্যাটিন ক্যাপিটাল লেটার ও |
হাত্তা | 80 | 80 | 80 | 80 | P |
Latin capital letter P | 81 | 81 | 81 | 81 | Q |
Latin capital letter Q | 82 | 82 | 82 | 82 | R |
Latin capital letter R | 83 | 83 | 83 | 83 | S |
Latin capital letter S | 84 | 84 | 84 | 84 | T |
Latin capital letter T | 85 | 85 | 85 | 85 | U |
Latin capital letter U | 86 | 86 | 86 | 86 | V |
Latin capital letter V | 87 | 87 | 87 | 87 | W |
Latin capital letter W | 88 | 88 | 88 | 88 | X |
Latin capital letter X | 89 | 89 | 89 | 89 | Y |
Latin capital letter Y | 90 | 90 | 90 | 90 | Z |
Latin capital letter Z | 91 | 91 | 91 | 91 | [ |
left square bracket | 92 | 92 | 92 | 92 | \ |
reverse solidus | 93 | 93 | 93 | 93 | ] |
right square bracket | 95 | 95 | 95 | 95 | ^ |
circumflex accent | _ | _ | _ | _ | low line |
96 | ` | ` | ` | ` | grave accent |
97 | a | a | a | a | Latin small letter a |
98 | b | b | b | b | Latin small letter b |
99 | c | c | c | c | Latin small letter c |
100 | d | d | d | d | Latin small letter d |
101 | e | e | e | e | Latin small letter e |
102 | f | f | f | f | Latin small letter f |
103 | g | g | g | g | Latin small letter g |
104 | h | h | h | h | Latin small letter h |
105 | i | i | i | i | Latin small letter i |
106 | j | j | j | j | Latin small letter j |
107 | k | k | k | k | Latin small letter k |
108 | l | l | l | l | Latin small letter l |
109 | m | m | m | m | Latin small letter m |
110 | n | n | n | n | Latin small letter n |
111 | o | o | o | o | Latin small letter o |
112 | p | p | p | p | Latin small letter p |
113 | q | q | q | q | Latin small letter q |
১১৪ | 114 | 114 | 114 | 114 | r |
Latin small letter r | 115 | 115 | 115 | 115 | s |
Latin small letter s | 116 | 116 | 116 | 116 | t |
Latin small letter t | 117 | 117 | 117 | 117 | u |
Latin small letter u | 118 | 118 | 118 | 118 | v |
Latin small letter v | 119 | 119 | 119 | 119 | w |
Latin small letter w | 120 | 120 | 120 | 120 | x |
Latin small letter x | 121 | 121 | 121 | 121 | y |
Latin small letter y | 122 | 122 | 122 | 122 | z |
Latin small letter z | 123 | 123 | 123 | 123 | { |
left curly bracket | | | | | | | | | vertical line |
125 | } | } | } | } | right curly bracket |
126 | ~ | ~ | ~ | ~ | tilde |
127 | DEL | ||||
128 | | euro sign | |||
129 | | | | নায়়াজ্ঞ | |
130 | | single low-9 quotation mark | |||
131 | | Latin small letter f with hook | |||
132 | | double low-9 quotation mark | |||
133 | horizontal ellipsis | ||||
134 | | dagger | |||
135 | | double dagger | |||
136 | | modifier letter circumflex accent | |||
137 | | per mille sign | |||
138 | | Latin capital letter S with caron | |||
139 | | single left-pointing angle quotation mark | |||
140 | | Latin capital ligature OE | |||
141 | | | | নায়়াজ্ঞ | |
142 | | Latin capital letter Z with caron | |||
143 | | | | নায়়াজ্ঞ | |
144 | | | | নায়়াজ্ঞ | |
145 | | left single quotation mark | |||
146 | | right single quotation mark | |||
147 | | left double quotation mark | |||
148 | | right double quotation mark | |||
১৪৯ | ১৪৯ | | |||
বুলেট | ১৫০ | | |||
ইউনডার ড্যাশ | | এম ড্যাশ | |||
১৫২ | | সমল টিল্ডা | |||
১৫৩ | | ট্রেডমার্ক সিগন | |||
১৫৪ | | ল্যাটিন স্মল লেটার এস ডিয়ায়ারিসিস | |||
১৫৫ | | সিঙ্গল রাইট-পইন্টিং অ্যাঙ্গেল কোয়াটাসন মার্ক | |||
১৫৬ | | ল্যাটিন স্মল লিগেচার ওয়াই | |||
১৫৭ | | | | নায়়াজ্ঞ | |
১৫৮ | | ল্যাটিন স্মল লেটার জে ডিয়ায়ারিসিস | |||
১৫৯ | | ল্যাটিন ক্যাপিটাল লেটার ওয়াই ডিয়ায়ারিসিস | |||
১৬০ | নো-ব্রেক স্পেস | ||||
১৬১ | ¡ | ¡ | ¡ | ইনভার্টেড এক্সলামেশন মার্ক | |
১৬২ | ¢ | ¢ | ¢ | সেন্ট সিগন | |
১৬৩ | £ | £ | £ | পাউন্ড সিগন | |
১৬৪ | ¤ | ¤ | ¤ | কারেন্সি সিগন | |
১৬৫ | ¥ | ¥ | ¥ | ইয়েন সিগন | |
১৬৬ | ¦ | ¦ | ¦ | ব্রকেন বার | |
১৬৭ | § | § | § | সেকশন সিগন | |
১৬৮ | ¨ | ¨ | ¨ | ডিয়াইয়ারিসিস | |
১৬৯ | © | © | © | কপিরাইট সিগন | |
১৭০ | ª | ª | ª | ফেমিনিন ওর্ডিনাল ইনডিকেটর | |
১৭১ | « | « | « | লেফট-পইন্টিং ডবল অ্যাঙ্গেল কোয়াটাসন মার্ক | |
১৭২ | ¬ | ¬ | ¬ | নট সিগন | |
১৭৩ | | | | সফট হাইফেন | |
১৭৪ | ® | ® | ® | রেজিস্টার্ড সিগন | |
১৭৫ | ¯ | ¯ | ¯ | ম্যাক্রন | |
১৭৬ | ° | ° | ° | ডিগ্রি সিগন | |
১৭৭ | ± | ± | ± | প্লাস-মিনাস সিগন | |
১৭৮ | ² | ² | ² | সুপারস্ক্রিপ্ট টু | |
১৭৯ | ³ | ³ | ³ | সুপারস্ক্রিপ্ট থ্রি | |
১৮০ | ´ | ´ | ´ | একুয়েট অ্যাকেন্ট | |
১৮১ | µ | µ | µ | মাইক্রো সিগন | |
১৮২ | ¶ | ¶ | ¶ | পিলক্রো সিগন | |
১৮৩ | · | · | · | মিডল ডট | |
১৮৪ | ¸ | ¸ | ¸ | সেডিলা | |
১৮৫ | ¹ | ¹ | ¹ | সুপারস্ক্রিপ্ট এক | |
১৮৬ | º | º | º | মস্কুলিন ওর্ডিনাল ইনডিকেটর | |
১৮৭ | মার্ক | মার্ক | মার্ক | রাইট-পইন্টিং ডবল অ্যাঙ্গেল কোয়াটাশন মার্ক | |
১৮৮ | ১/৪ | ১/৪ | ১/৪ | ভুলগার ফ্র্যাকশন ওয়ান কোয়ার্টার | |
১৯০ | ১/২ | ১/২ | ১/২ | ভুলগার ফ্র্যাকশন ওয়ান হ্যাল্ফ | |
১৯০ | ৩/৪ | ৩/৪ | ৩/৪ | ভুলগার ফ্র্যাকশন থ্রি কোয়ার্টার | |
১৯১ | কোয়েশটন মার্ক | কোয়েশটন মার্ক | কোয়েশটন মার্ক | ইনভার্টেড কোয়েশটন মার্ক | |
১৯২ | এ | এ | এ | ল্যাটিন ক্যাপিটাল লেটার এ সহ গ্রেভ | |
১৯৩ | এ | এ | এ | ল্যাটিন ক্যাপিটাল লেটার এ সহ অকুট | |
১৯৪ | এ | এ | এ | ল্যাটিন ক্যাপিটাল লেটার এ সহ সারকাইম্বেক্স | |
১৯৫ | এ | এ | এ | ল্যাটিন ক্যাপিটাল লেটার এ সহ টিল্ড | |
১৯৬ | এ | এ | এ | ল্যাটিন ক্যাপিটাল লেটার এ সহ ডায়ারেসিস | |
১৯৭ | এ | এ | এ | ল্যাটিন ক্যাপিটাল লেটার এ সহ রিং ওভার | |
১৯৮ | এ | এ | এ | ল্যাটিন ক্যাপিটাল লেটার এই | |
১৯৯ | সি | সি | সি | ল্যাটিন ক্যাপিটাল লেটার সি সহ সিডিল | |
২০০ | ই | ই | ই | ল্যাটিন ক্যাপিটাল লেটার ই সহ গ্রেভ | |
২০১ | ই | ই | ই | ল্যাটিন ক্যাপিটাল লেটার ই সহ অকুট | |
২০২ | ই | ই | ই | ল্যাটিন ক্যাপিটাল লেটার ই সহ সারকাইম্বেক্স | |
২০৩ | ই | ই | ই | ল্যাটিন ক্যাপিটাল লেটার ই সহ ডায়ারেসিস | |
২০৪ | আই | আই | আই | ল্যাটিন ক্যাপিটাল লেটার আই সহ গ্রেভ | |
২০৫ | আই | আই | আই | ল্যাটিন ক্যাপিটাল লেটার আই সহ অকুট | |
২০৬ | আই | আই | আই | ল্যাটিন ক্যাপিটাল লেটার আই সহ সারকাইম্বেক্স | |
২০৭ | আই | আই | আই | ল্যাটিন ক্যাপিটাল লেটার আই সহ ডায়ারেসিস | |
২০৮ | ডিডেল | ডিডেল | ডিডেল | ল্যাটিন ক্যাপিটাল লেটার ইথ | |
২০৯ | এন | এন | এন | ল্যাটিন ক্যাপিটাল লেটার এন সহ টিল্ড | |
২১০ | অ | অ | অ | ল্যাটিন ক্যাপিটাল লিটার O সঙ্গে গ্রেভ | |
২১১ | অ | অ | অ | ল্যাটিন ক্যাপিটাল লিটার O সঙ্গে অক্যুট | |
২১২ | অ | অ | অ | ল্যাটিন ক্যাপিটাল লিটার O সঙ্গে সার্কামফ্লেক্স | |
২১৩ | অ | অ | অ | ল্যাটিন ক্যাপিটাল লিটার O সঙ্গে টিল্ড | |
২১৪ | অ | অ | অ | ল্যাটিন ক্যাপিটাল লিটার O সঙ্গে ডায়ারেসিস | |
২১৫ | × | × | × | গুণ সঙ্কেত | |
২১৬ | অ | অ | অ | ল্যাটিন ক্যাপিটাল লিটার O সঙ্গে স্ট্রক | |
২১৭ | ই | ই | ই | ল্যাটিন ক্যাপিটাল লিটার U সঙ্গে গ্রেভ | |
২১৮ | ই | ই | ই | ল্যাটিন ক্যাপিটাল লিটার U সঙ্গে অক্যুট | |
২১৯ | ই | ই | ই | ল্যাটিন ক্যাপিটাল লিটার U সঙ্গে সার্কামফ্লেক্স | |
২২০ | ই | ই | ই | ল্যাটিন ক্যাপিটাল লিটার U সঙ্গে ডায়ারেসিস | |
২২১ | ই | ই | ই | ল্যাটিন ক্যাপিটাল লিটার Y সঙ্গে অক্যুট | |
২২২ | থ | থ | থ | ল্যাটিন ক্যাপিটাল লিটার থর্ন | |
২২৩ | স | স | স | ল্যাটিন ছোট অক্ষর শার্প এস | |
২২৪ | অ | অ | অ | ল্যাটিন ছোট অক্ষর a সঙ্গে গ্রেভ | |
২২৫ | অ | অ | অ | ল্যাটিন ছোট অক্ষর a সঙ্গে অক্যুট | |
২২৬ | অ | অ | অ | ল্যাটিন ছোট অক্ষর a সঙ্গে সার্কামফ্লেক্স | |
২২৭ | অ | অ | অ | ল্যাটিন ছোট অক্ষর a সঙ্গে টিল্ড | |
২২৮ | অ | অ | অ | ল্যাটিন ছোট অক্ষর a সঙ্গে ডায়ারেসিস | |
২২৯ | অ | অ | অ | ল্যাটিন ছোট অক্ষর a সঙ্গে রিং ওভার | |
২৩০ | এ | এ | এ | ল্যাটিন ছোট অক্ষর ae | |
২৩১ | স | স | স | ল্যাটিন ছোট অক্ষর c সঙ্গে সিডিল | |
২৩২ | এ | এ | এ | ল্যাটিন ছোট অক্ষর e সঙ্গে গ্রেভ | |
233 | é | é | é | Latin small letter e with acute | |
234 | ê | ê | ê | Latin small letter e with circumflex | |
235 | ë | ë | ë | Latin small letter e with diaeresis | |
236 | ì | ì | ì | Latin small letter i with grave | |
237 | í | í | í | Latin small letter i with acute | |
238 | î | î | î | Latin small letter i with circumflex | |
239 | ï | ï | ï | Latin small letter i with diaeresis | |
240 | ð | ð | ð | Latin small letter eth | |
241 | ñ | ñ | ñ | Latin small letter n with tilde | |
242 | ò | ò | ò | Latin small letter o with grave | |
243 | ó | ó | ó | Latin small letter o with acute | |
244 | ô | ô | ô | Latin small letter o with circumflex | |
245 | õ | õ | õ | Latin small letter o with tilde | |
246 | ö | ö | ö | Latin small letter o with diaeresis | |
247 | ÷ | ÷ | ÷ | division sign | |
248 | ø | ø | ø | Latin small letter o with stroke | |
249 | ù | ù | ù | Latin small letter u with grave | |
250 | ú | ú | ú | Latin small letter u with acute | |
251 | û | û | û | Latin small letter with circumflex | |
252 | ü | ü | ü | Latin small letter u with diaeresis | |
253 | ý | ý | ý | Latin small letter y with acute | |
254 | þ | þ | þ | Latin small letter thorn | |
255 | ÿ | ÿ | ÿ | Latin small letter y with diaeresis |
ASCII ตัวอักษร
ASCII 0 ถึง 31 (และ 127) ระหว่างค่าใช้เป็นตัวควบคุม
ASCII 32 থেকে 126-এর মধ্যে মূল্যকে অক্ষর, সংখ্যা এবং সংকেত প্রদর্শন করে
ASCII 128 থেকে 255-এর মধ্যে মূল্যকে ব্যবহার করে না
ANSI চারিত্রিক সংখ্যা (Windows-1252)
0 থেকে 127-এর মধ্যে মূল্যের জন্য, ANSI ASCII-এর সমতুল
ANSI 128 থেকে 159-এর মধ্যে মূল্যকে একটি বিশেষ চারিত্রিক সংখ্যা গোষ্ঠীতে ব্যবহার করে
160 থেকে 255-এর মধ্যে মূল্যের জন্য, ANSI UTF-8-এর সমতুল
ISO-8859-1 চারিত্রিক সংখ্যা
0 থেকে 127-এর মধ্যে মূল্যের জন্য, 8859-1 ASCII-এর সমতুল
8859-1 128 থেকে 159-এর মধ্যে মূল্যকে ব্যবহার করে না
160 থেকে 255-এর মধ্যে মূল্যের জন্য, 8859-1 UTF-8-এর সমতুল
UTF-8 চারিত্রিক সংখ্যা
0 থেকে 127-এর মধ্যে মূল্যের জন্য, UTF-8 ASCII-এর সমতুল
UTF-8 12 8 থেকে 159-এর মধ্যে মূল্যকে ব্যবহার করে না
160 থেকে 255 এর মধ্যে মূল্যের জন্য, UTF-8 ANSI এবং 8859-1-এর সমতুল
UTF-8 256 থেকে মূল্যকে প্রসারিত করে, 10,000-এরও বেশি ভিন্ন চারিত্রিক সংখ্যা ধারণ করে
আরও গভীর অধ্যয়নের জন্য, আমাদের সম্পূর্ণ HTML চারিত্রিক সংখ্যা রেফারেন্স ম্যানুয়াল পড়ুন
@charset CSS নিয়ম
আপনি CSS @charset নিয়ম ব্যবহার করে স্টাইলশিটে ব্যবহৃত চারিত্রিক এনকোডিং নির্দিষ্ট করতে পারেন
উদাহরণ
স্টাইলশিটের এনকোডিংকে Unicode UTF-8 হিসাবে সেট করুন
@charset "UTF-8";
আপনার জন্য আরও বেশি জানতে, আমাদের CSS রেফারেন্স ম্যানুয়ালটি দেখুন CSS @charset নিয়ম এর অন্তর্ভুক্ত
- পূর্ববর্তী পৃষ্ঠা HTML ইমোজি
- পরবর্তী পৃষ্ঠা HTML URL