HTML Unicode (UTF-8) مراجع دستاویز
- بال پیغام HTML نمائش
- پایین پیغام لاتین بیلتائی بنیادیات
Unicode یونین
Unicode یونین نے Unicode معیار تیار کیا ہے، ان کا مقصد اس کے معیاری Unicode تبدیل فورمات (UTF) کو موجودہ کلمات کا حامل کلمات کا حامل تبدیل کرنا ہے
Unicode معیار کامیابی سے حاصل کیا ہے، اور HTML، XML، Java، JavaScript، ای میل، ASP، PHP وغیرہ کے ذریعہ عمل میں لایا گیا ہے۔ کئی آپریٹنگ سسٹم اور تمام جدید بروزر میں Unicode معیار کا پشتیبندگی کیا جاتا ہے
Unicode یونین اور لیڈنگ اسٹینڈرڈ ڈیولپمنٹ آرگنائزیشن (مثلاً ISO، W3C اور ECMA) کے ساتھ تعاون کر رہی ہے
Unicode کلمات
Unicode مختلف کلمات کا ذریعہ مختلف کلمات کا ذریعہ بن سکتا ہے، سب سے زیادہ استعمال شدہ کد UTF-8 اور UTF-16 ہیں:
ਅੱਖਰ ਪਰਿਵਾਰ | موضح کریں |
---|---|
UTF-8 |
UTF8 میں کلموں کی لمبائی 1 سے 4 بائیٹس تک ہو سکتی ہے UTF-8 کسی بھی Unicode معیار میں کلموں کو ظاہر کر سکتا ہے UTF-8 بائی ASCII کی وارثیتی کی حامل ہے۔ UTF-8 ای میل اور ویب پینج کا ترجیحی کد ہے |
UTF-16 |
16 ਬਿਟ Unicode ਟਰਾਂਸਫਾਰਮਰ ਫਾਰਮੈਟ ਇੱਕ ਵਿਵਸਥਿਤ ਲੰਬਾਈ ਦਾ Unicode ਚਿੰਨ੍ਹ ਕੋਡਿੰਗ ਹੈ ਜੋ ਸਮੁੱਚੇ Unicode ਰਿਪੋਜ਼ੀਟਰੀ ਨੂੰ ਕੋਡ ਕਰ ਸਕਦਾ ਹੈ。 UTF-16 ਮੁੱਖ ਆਪਲੀਕੇਸ਼ਨ ਪ੍ਰੋਸੈਸਿੰਗ ਅਤੇ ਵਾਤਾਵਰਣਾਂ ਲਈ ਵਰਤਿਆ ਜਾਂਦਾ ਹੈ ਜਿਵੇਂ ਕਿ Microsoft Windows、Java ਅਤੇ .NET。 |
ਟਿੱਪਣੀ:Unicode ਦੇ ਪਹਿਲੇ 128 ਅੱਖਰ (ASCII ਨਾਲ ਇੱਕ-ਇੱਕ ਅਨੁਰੂਪ) ਇੱਕ ਸਿੱਧੇ ਆਟੋਕੇਡ ਬਾਈਟ ਕੋਡਿੰਗ ਵਿੱਚ ਕੋਡ ਕੀਤੇ ਜਾਂਦੇ ਹਨ، ਇਹ ਆਟੋਕੇਡ ਬਾਈਟ ਇੱਕ ਅਜਿਹੇ ਬਾਇਨਰੀ ਕੀਮਤ ਨੂੰ ਰੱਖਦੇ ਹਨ ਜੋ ASCII ਦੇ ਬਾਇਨਰੀ ਕੀਮਤ ਨਾਲ ਸਮਾਨ ਹਨ ਜਿਸ ਨਾਲ ਸ਼ਾਨਦਾਰ ASCII ਟੈਕਸਟ ਵੀ ਇੱਕ ਸ਼ਾਨਦਾਰ UTF-8 ਕੋਡਿੰਗ ਬਣਦਾ ਹੈ。
ਸੁਝਾਅ:HTML 4 UTF-8 ਨੂੰ ਸਮਰਥਿਤ ਕਰਦਾ ਹੈ। HTML 5 UTF-8 ਅਤੇ UTF-16 ਨੂੰ ਸਮਰਥਿਤ ਕਰਦਾ ਹੈ!
HTML5 ਸਟੈਂਡਰਡ: Unicode UTF-8
ਕਿਉਂਕਿ ISO-8859 ਵਿੱਚ ਅੱਖਰ ਪਰਿਵਾਰ ਦਾ ਅਕਾਰ ਸੀਮਤ ਹੈ ਅਤੇ ਬਹੁਭਾਾ ਵਾਲੇ ਵਾਤਾਵਰਣ ਨਾਲ ਸਮਾਨਤਾ ਨਹੀਂ ਹੈ ਤਾਂ Unicode ਐਸੋਸੀਏਸ਼ਨ ਨੇ Unicode ਸਟੈਂਡਰਡ ਵਿਕਸਿਤ ਕੀਤਾ ਹੈ。
Unicode ਸਟੈਂਡਰਡ (ਲਗਭਗ) ਦੁਨੀਆ ਦੇ ਸਾਰੇ ਅੱਖਰਾਂ، ਟਾਇਪੋਗ੍ਰਾਫਿਕ ਅੱਖਰਾਂ ਅਤੇ ਚਿੰਨ੍ਹਾਂ ਨੂੰ ਕਵਰ ਕਰਦਾ ਹੈ。
Unicode ਪਲੇਟਫਾਰਮ ਅਤੇ ਭਾਸ਼ਾ ਤੋਂ ਅਲੱਗ ਤੇਲਸਤੀ ਟੈਕਸਟ ਪ੍ਰੋਸੈਸਿੰਗ, ਸਟੋਰੇਜ ਅਤੇ ਟ੍ਰਾਂਸਮਿਸ਼ਨ ਸਮਰਥਿਤ ਕਰਦਾ ਹੈ。
HTML5 ਵਿੱਚ ਮੂਲਤਬੀ ਅੱਖਰ ਕੋਡਿੰਗ UTF-8 ਹੈ。
ਜੇਕਰ HTML5 ਵੈੱਬਸਾਈਟ ਦਾ ਅੱਖਰ ਪਰਿਵਾਰ UTF-8 ਨਾਲ ਨਹੀਂ ਹੈ ਤਾਂ <meta> ਟੈਗ ਵਿੱਚ ਉਸ ਅੱਖਰ ਪਰਿਵਾਰ ਨੂੰ ਸੂਚਿਤ ਕਰਨਾ ਚਾਹੀਦਾ ਹੈ,ਉਦਾਹਰਣ ਵਜੋਂ:
ਉਦਾਹਰਣ
<meta charset="ISO-8859-1">
Unicode ਅਤੇ UTF-8 ਦਰਮਿਆਨ ਅੰਤਰ
Unicode ਇੱਕ ਅੱਖਰ ਪਰਿਵਾਰ ਹੈ। UTF-8 ਇੱਕ ਕੋਡਿੰਗ ਹੈ。
Unicode ਇੱਕ ਅਨੂਠੀ ਦਸਮਾਂਸਕ ਸੂਚੀ (ਕੋਡ ਪੁਆਇੰਟ) ਦੇ ਅੱਖਰ ਹੈ। A = 65،B = 66،C = 67،...。
ਇਹ ਦਸਮਾਂਸਕ ਸੂਚੀ ਆਪਣੇ ਲਈ "hello" ਚਿੰਨ੍ਹਾਂ ਦੀ ਪ੍ਰਤੀਨਿਧਤਾ ਕਰਦੀ ਹੈ: 104 101 108 108 111
ਕੋਡਿੰਗ ਇਹ ਸੰਖਿਆ ਨੂੰ ਬਾਇਨਰੀ ਸੰਖਿਆ ਵਿੱਚ ਬਦਲ ਕੇ ਕੰਪਿਊਟਰ ਵਿੱਚ ਸਟੋਰੇਜ ਕਰਨ ਦਾ ਤਰੀਕਾ ਹੈ:
UTF-8 ਕੋਡਿੰਗ ਇਸ ਤਰ੍ਹਾਂ (ਬਾਇਨਰੀ) "hello" ਦੀ ਸਟੋਰੇਜ ਕਰੇਗਾ: 01101000 01100101 01101100 01101100 01101111
ਕੋਡਿੰਗਸੰਖਿਆ ਨੂੰ ਬਾਇਨਰੀ ਵਿੱਚ ਬਦਲੋ。ਅੱਖਰ ਪਰਿਵਾਰਅੱਖਰ ਨੂੰ ਸੰਖਿਆ ਵਿੱਚ ਬਦਲੋ。
HTML5 UTF-8 ਅੱਖਰ ਕੋਡ
ਹੇਠ ਦੇ ਸ਼ੂਟਲਿਸਟ ਵਿੱਚ HTML5 ਦੁਆਰਾ ਸਮਰਥਿਤ ਕੁਝ UTF-8 ਅੱਖਰ ਕੋਡ ਦੀ ਸੂਚੀ ਹੈ:
ਅੱਖਰ ਕੋਡ | ਦਸਮਾਂਸਕ | ਦਸਹਰਾ |
---|---|---|
C0 Controls and Basic Latin | 0-127 | 0000-007F |
C1 Controls and Latin-1 Supplement | 128-255 | 0080-00FF |
Latin Extended-A | 256-383 | 0100-017F |
Latin Extended-B | 384-591 | 0180-024F |
Spacing Modifiers | 688-767 | 02B0-02FF |
Diacritical Marks | 768-879 | 0300-036F |
Greek and Coptic | 880-1023 | 0370-03FF |
Cyrillic Basic | 1024-1279 | 0400-04FF |
Cyrillic Supplement | 1280-1327 | 0500-052F |
General Punctuation | 8192-8303 | 2000-206F |
Currency Symbols | 8352-8399 | 20A0-20CF |
Letterlike Symbols | 8448-8527 | 2100-214F |
Arrows | 8592-8703 | 2190-21FF |
Mathematical Operators | 8704-8959 | 2200-22FF |
Box Drawings | 9472-9599 | 2500-257F |
Block Elements | 9600-9631 | 2580-259F |
Geometric Shapes | 9632-9727 | 25A0-25FF |
Miscellaneous Symbols | 9728-9983 | 2600-26FF |
Dingbats | 9984-10175 | 2700-27BF |
- بال پیغام HTML نمائش
- پایین پیغام لاتین بیلتائی بنیادیات