HTML चारित्रसमूह
- पिछला पृष्ठ HTML चारित्रसमूह
- अगला पृष्ठ HTML ASCII
वैध रूप से HTML पृष्ठ दिखाने के लिए, ब्राउज़र को उपयोग करने वाली चार्टेट (एन्कोडिंग) को जानना चाहिए:
उदाहरण
<meta charset="UTF-8">
HTML चारित्रसमूह
HTML5 नियमन वेब डेवलपर्स को UTF-8 चार्टेट का उपयोग करने को प्रोत्साहित करता है!
यह हमेशा नहीं रहा। प्रारंभिक वेब के चार्टर एन्कोडिंग ASCII था।
बाद में, HTML 2.0 से HTML 4.01 तक, ISO-8859-1 एक मानक चार्टेट के रूप में देखी जाती थी।
XML और HTML5 के साथ, UTF-8 अंततः उत्पन्न हुआ और कई चार्टर एन्कोडिंग के समस्याओं को हल किया।
प्रारंभ में: ASCII
कंप्यूटर डाटा इलेक्ट्रॉनिक उपकरण में द्विपदी कोड (01000101) के रूप में स्टोर किया जाता है।
पाठ के स्टोरेज को स्टैंडर्ड करने के लिए, अमेरिकन स्टैंडर्ड कोड फॉर इंफॉर्मेशन इंटरचेंज (एसीआई) को बनाया गया था। इसने प्रत्येक स्टोरेज के लिए एक अलग-अलग बाइनरी नंबर निर्धारित किया है, जो 0-9 के नंबर, बड़े और छोटे अक्षर (a-z, A-Z) और विशेष चार्टर (जैसे ! $ + - ( ) @ < > ,) को समर्थित करता है।
एक्सीसी 7 बिट चार्टर का उपयोग करता है, इसलिए यह केवल 128 अलग-अलग अक्षरों को प्रदर्शित कर सकता है।
एक्सीसी का सबसे बड़ा दोष यह है कि यह अंग्रेजी अक्षरों को ही समर्थित करता है।
आज एक्सीसी अभी भी इस्तेमाल किया जा रहा है, विशेष रूप से बड़े होस्ट कंप्यूटर प्रणालियों में।
अधिक शोध के लिए हमारे पूर्ण ASCII संदर्भ।
विंडोज में: Windows-1252
Windows-1252 विंडोज (विंडोज 95 तक) में डिफ़ॉल्ट चार्टेट है।
यह एक्सीसी का एक्सटेंशन है जो अंतर्राष्ट्रीय अक्षरों को जोड़ता है।
यह एक पूर्ण बाइट (8 बिट) का उपयोग करके 256 अलग-अलग अक्षरों को प्रदर्शित करता है।
क्योंकि Windows-1252 विंडोज में डिफ़ॉल्ट सेटिंग है, इसलिए सभी ब्राउज़र इसे समर्थित करते हैं।
अधिक शोध के लिए हमारे पूर्ण Windows-1252 संदर्भ।
HTML 4 में: ISO-8859-1
HTML 4 में सबसे अधिक इस्तेमाल की जाने वाली चार्टेट ISO-8859-1 है।
ISO-8859-1 एक्सीसी एक्सटेंशन है जो अंतर्राष्ट्रीय अक्षरों को जोड़ता है।
उदाहरण
<meta http-equiv="Content-Type" content="text/html;charset=ISO-8859-1">
HTML 4 में, <meta> टैग में ISO-8859-1 के अलावा किसी भी चारित्रसमूह को निर्दिष्ट कर सकते हैं:
उदाहरण
<meta http-equiv="Content-Type" content="text/html;charset=ISO-8859-8">
सभी HTML 4 प्रोसेसर भी UTF-8 का समर्थन करते हैं:
उदाहरण
<meta http-equiv="Content-Type" content="text/html;charset=UTF-8">
सूचना:जब ब्राउज़र ISO-8859-1 का पता लगाता है, तो यह आमतौर पर Windows-1252 को डिफ़ॉल्ट मानता है क्योंकि Windows-1252 में 32 अंतर्राष्ट्रीय चारित्र हैं।
अधिक शोध के लिए हमारे पूर्ण ISO-8859-1 संदर्भ।
HTML5 में: Unicode UTF-8
HTML5 नियमन वेब डेवलपर्स को UTF-8 चारित्रसमूह का उपयोग करने के लिए प्रोत्साहित करता है。
उदाहरण
<meta charset="UTF-8">
आप <meta> टैग में UTF-8 के अलावा किसी भी चारित्रसमूह को निर्दिष्ट कर सकते हैं:
उदाहरण
<meta charset="ISO-8859-1">
Unicode यूनियन ने UTF-8 और UTF-16 मानक विकसित किए हैं क्योंकि ISO-8859 चारित्रसमूह सीमित है और बहुभाषी पर्यावरण से समर्थन नहीं करता है।
Unicode मानक (लगभग) दुनिया के सभी चारित्र, चिह्न और प्रतीक को कवर करता है।
सूचना:सभी HTML5 और XML प्रोसेसर UTF-8, UTF-16, Windows-1252 और ISO-8859 का समर्थन करते हैं。
अधिक शोध के लिए हमारे पूर्ण Unicode संदर्भ।
- पिछला पृष्ठ HTML चारित्रसमूह
- अगला पृष्ठ HTML ASCII