HTML ਚਾਰਕਟ ਸੈਟ
- ਪਿੰਡਾ ਪੰਨਾ HTML ਚਾਰਕਟ ਸੈਟ
- ਅਗਲਾ ਪੰਨਾ HTML ਐਸਕੀ ਐਸੀ
ਹੈਲਚਰ ਹੁੰਦੇ ਹੋਏ ਹੈਲਚਰ ਪੇਜ ਦੇ ਸਹੀ ਪ੍ਰਦਰਸ਼ਨ ਲਈ ਬਰਾਉਜ਼ਰ ਨੂੰ ਵਰਤਣ ਵਾਲੇ ਅੱਖਰ-ਸਮੂਹ (ਕੋਡੇਸ਼ਨ) ਜਾਣਨਾ ਹੋਵੇਗਾ:
ਇਨਸਟੈਂਸ
<meta charset="UTF-8">
HTML ਚਾਰਕਟ ਸੈਟ
HTML5 ਸਮਾਨਤਾ ਨੇ ਵੈਬ ਵਿਕਾਸਕਾਰਾਂ ਨੂੰ UTF-8 ਅੱਖਰ-ਸਮੂਹ ਵਰਤਣ ਲਈ ਪ੍ਰੋਤਸਾਹਿਤ ਕੀਤਾ ਹੈ!
ਪਰ ਇਹ ਹਮੇਸ਼ਾ ਨਹੀਂ ਰਿਹਾ ਹੈ। ਪ੍ਰਾਰੰਭਿਕ ਵੈਬ ਦੇ ਅੱਖਰ-ਸਮੂਹ ASCII ਸੀ。
ਬਾਅਦ ਵਿੱਚ HTML 2.0 ਤੋਂ HTML 4.01 ਤੱਕ ISO-8859-1 ਨੂੰ ਮਿਆਰ ਅੱਖਰ-ਸਮੂਹ ਮੰਨਿਆ ਗਿਆ ਸੀ。
XML ਅਤੇ HTML5 ਦੇ ਨਾਲ, UTF-8 ਅੰਤਮ ਤੌਰ 'ਤੇ ਸਾਰੇ ਅੱਖਰ-ਸਮੂਹ ਪ੍ਰੋਬਲਮਾਂ ਨੂੰ ਹੱਲ ਕਰਨ ਲਈ ਆਇਆ ਹੈ。
ਸ਼ੁਰੂਆਤੀ: ASCII
ਕੰਪਿਊਟਰ ਡਾਟਾ ਇਲੈਕਟ੍ਰੌਨਿਕ ਉਪਕਰਣ ਵਿੱਚ ਬਿਨਾਰੀ ਕੋਡ (01000101) ਵਿੱਚ ਸਟੋਰ ਕੀਤਾ ਜਾਂਦਾ ਹੈ。
ਟੈਕਸਟ ਦੀ ਸਟੈਂਡਰਡਾਈਜ਼ੇਸ਼ਨ ਲਈ ਅਮਰੀਕਨ ਸਟੈਂਡਰਡ ਕੋਡ ਫਾਰ ਇੰਫਾਰਮੇਸ਼ਨ ਇੰਟਰਚੇਂਜ (American Standard Code for Information Interchange, ASCII) ਬਣਾਇਆ ਗਿਆ ਹੈ। ਇਸ ਨੇ ਹਰੇਕ ਸਟੋਰੇਬਲ ਅੱਖਰ ਨੂੰ ਇੱਕ ਅਲੱਗ ਬਿਨਾਰੀ ਨੰਬਰ ਦੇ ਪਰਿਭਾਸ਼ਿਤ ਕੀਤਾ ਹੈ ਤਾਂ ਕਿ 0-9 ਦੇ ਨੰਬਰ, ਉੱਚਾ ਅਤੇ ਛੋਟਾ ਅੱਖਰ (a-z, A-Z) ਅਤੇ ਵਿਸ਼ੇਸ਼ ਅੱਖਰ (ਜਿਵੇਂ ! $ + - ( ) @ < > ,) ਨੂੰ ਸਮਰਥਿਤ ਕਰ ਸਕੇ।
ਕਿਉਂਕਿ ASCII 7 ਬਿਟ ਦੇ ਅੱਖਰਾਂ ਦੀ ਵਰਤੋਂ ਕਰਦਾ ਹੈ ਇਸ ਲਈ ਇਸ ਨੂੰ ਸਿਰਫ 128 ਵੱਖ-ਵੱਖ ਅੱਖਰਾਂ ਨੂੰ ਪ੍ਰਦਰਸ਼ਿਤ ਕਰਨ ਦੀ ਸਮਰੱਥਾ ਹੈ。
ASCII ਦਾ ਸਭ ਤੋਂ ਵੱਡਾ ਨਾਕਾਮੀ ਇਹ ਹੈ ਕਿ ਇਹ ਅੰਗਰੇਜ਼ੀ ਅੱਖਰਾਂ ਤੋਂ ਬਾਹਰ ਦੇ ਅੱਖਰਾਂ ਨੂੰ ਹਟਾ ਦਿੰਦਾ ਹੈ。
ਇਸ ਵੇਲੇ ਵੀ ASCII ਵਰਤੀ ਜਾਂਦੀ ਹੈ ਖਾਸ ਤੌਰ 'ਤੇ ਵੱਡੇ ਮੁੱਖ ਕੰਪਿਊਟਰ ਸਿਸਟਮਾਂ ਵਿੱਚ。
ਹੋਰ ਗਹਿਰੇ ਅਧਿਐਨ ਲਈ ਸਾਡੇ ਦੌਰੇ ਲਈ ਜਾਵੋਗੇ ਪੂਰਾ ASCII ਹਵਾਲਾ。
Windows ਵਿੱਚ: Windows-1252
Windows-1252 Windows (ਜਦੋਂ ਤੱਕ Windows 95) ਵਿੱਚ ਮੂਲਰਤੰਤਰ ਅੱਖਰ-ਸਮੂਹ ਹੈ。
ਇਹ ASCII ਦੀ ਵਧਾਈ ਹੈ ਅਤੇ ਅੰਤਰਰਾਸ਼ਟਰੀ ਅੱਖਰਾਂ ਨੂੰ ਜੋੜਿਆ ਹੈ。
ਇਹ ਇੱਕ ਪੂਰੀ ਬਾਈਟ (8 ਬਿਟ) ਵਰਤ ਕੇ 256 ਵੱਖ-ਵੱਖ ਅੱਖਰਾਂ ਨੂੰ ਪ੍ਰਦਰਸ਼ਿਤ ਕਰਦਾ ਹੈ。
ਕਿਉਂਕਿ Windows-1252 Windows ਵਿੱਚ ਮੂਲਰਤੰਤਰ ਸੈਟਿੰਗ ਹੈ ਇਸ ਲਈ ਸਾਰੇ ਬਰਾਉਜ਼ਰ ਇਸ ਨੂੰ ਸਮਰਥਨ ਕਰਦੇ ਹਨ。
ਹੋਰ ਗਹਿਰੇ ਅਧਿਐਨ ਲਈ ਸਾਡੇ ਦੌਰੇ ਲਈ ਜਾਵੋਗੇ ਪੂਰਾ Windows-1252 ਹਵਾਲਾ。
HTML 4 ਵਿੱਚ: ISO-8859-1
HTML 4 ਵਿੱਚ ਸਭ ਤੋਂ ਵਧੇਰੇ ਵਰਤਿਆ ਹੋਣ ਵਾਲਾ ਅੱਖਰ-ਸਮੂਹ ISO-8859-1 ਹੈ。
ISO-8859-1 ਹੈ ASCII ਦੀ ਵਧਾਈ ਅਤੇ ਅੰਤਰਰਾਸ਼ਟਰੀ ਅੱਖਰਾਂ ਨੂੰ ਜੋੜਿਆ ਹੈ。
ਇਨਸਟੈਂਸ
<meta http-equiv="Content-Type" content="text/html;charset=ISO-8859-1">
ਹੈਲਜੀਏਸੀ 4 ਵਿੱਚ، <meta> ਟੈਗ ਵਿੱਚ ISO-8859-1 ਤੋਂ ਵੱਖ ਚਾਰਕਟ ਸੈਟ ਸਪੱਸ਼ਟ ਕੀਤਾ ਜਾ ਸਕਦਾ ਹੈ:
ਇਨਸਟੈਂਸ
<meta http-equiv="Content-Type" content="text/html;charset=ISO-8859-8">
ਸਾਰੇ ਹੈਲਜੀਏਸੀ 4 ਪ੍ਰੋਸੈਸਰਜ਼ ਵੀ UTF-8 ਨੂੰ ਸਮਰਥਤ ਕਰਦੇ ਹਨ:
ਇਨਸਟੈਂਸ
<meta http-equiv="Content-Type" content="text/html;charset=UTF-8">
ਸੁਝਾਅ:ਜਦੋਂ ਬਰਾਉਜ਼ਰ ਨੂੰ ISO-8859-1 ਮਿਲਦਾ ਹੈ ਤਾਂ ਉਹ ਸਧਾਰਨ ਤੌਰ 'ਤੇ Windows-1252 ਨੂੰ ਡਿਫਾਲਟ ਮੰਨਦਾ ਹੈ ਕਿਉਂਕਿ Windows-1252 ਵਿੱਚ 32 ਅੰਤਰਰਾਸ਼ਟਰੀ ਚਾਰਕਟ ਹਨ。
ਹੋਰ ਗਹਿਰੇ ਅਧਿਐਨ ਲਈ ਸਾਡੇ ਦੌਰੇ ਲਈ ਜਾਵੋਗੇ ਪੂਰਾ ISO-8859-1 ਰੈਫਰੈਂਸ。
ਹੈਲਜੀਏਸੀ 5 ਵਿੱਚ: Unicode UTF-8
ਹੈਲਜੀਏਸੀ 5 ਸਟੈਂਡਰਡ ਵਲੋਂ Web ਵਿਕਾਸਕਾਰਾਂ ਨੂੰ UTF-8 ਚਾਰਕਟ ਸੈਟ ਦੀ ਇਸਤੇਮਾਲ ਕਰਨ ਨੂੰ ਪ੍ਰਸਤਾਵਿਤ ਕੀਤਾ ਗਿਆ ਹੈ。
ਇਨਸਟੈਂਸ
<meta charset="UTF-8">
ਮੀਟਾ ਟੈਗ ਵਿੱਚ ਯੂਐਫ-8 ਤੋਂ ਵੱਖ ਚਾਰਕਟ ਸੈਟ ਸਪੱਸ਼ਟ ਕੀਤਾ ਜਾ ਸਕਦਾ ਹੈ:
ਇਨਸਟੈਂਸ
<meta charset="ISO-8859-1">
ਯੂਨੀਕੋਡ ਐਸੋਸੀਏਸ਼ਨ ਨੇ UTF-8 ਅਤੇ UTF-16 ਸਟੈਂਡਰਡ ਵਿਕਸਿਤ ਕੀਤੇ ਹਨ ਕਿਉਂਕਿ ISO-8859 ਚਾਰਕਟ ਸੈਟ ਸੀਮਤ ਹੈ ਅਤੇ ਬਹੁਭਾਸ਼ੀ ਮਾਹੌਲ ਨਾਲ ਸਮਝੌਤਾ ਨਹੀਂ ਕਰਦਾ ਹੈ。
ਯੂਨੀਕੋਡ ਸਟੈਂਡਰਡ (ਕਿਤਨੇ ਹੀ) ਦੁਨੀਆ ਦੇ ਸਾਰੇ ਚਾਰਕਟਾਂ, ਸੰਦੇਸ਼ਾਂ ਅਤੇ ਚਿੰਨ੍ਹਾਂ ਨੂੰ ਕਵਰ ਕਰਦਾ ਹੈ。
ਸੁਝਾਅ:ਸਾਰੇ ਹੈਲਜੀਏਸੀ 5 ਅਤੇ XML ਪ੍ਰੋਸੈਸਰਜ਼ UTF-8, UTF-16, Windows-1252 ਅਤੇ ISO-8859 ਦਾ ਸਮਰਥਨ ਕਰਦੇ ਹਨ。
ਹੋਰ ਗਹਿਰੇ ਅਧਿਐਨ ਲਈ ਸਾਡੇ ਦੌਰੇ ਲਈ ਜਾਵੋਗੇ ਪੂਰਾ ਯੂਨੀਕੋਡ ਰੈਫਰੈਂਸ。
- ਪਿੰਡਾ ਪੰਨਾ HTML ਚਾਰਕਟ ਸੈਟ
- ਅਗਲਾ ਪੰਨਾ HTML ਐਸਕੀ ਐਸੀ