HTML Character Set

Upang maipakita nang tama ang pahina ng HTML, kailangan alam ng browser ang charset (encoding) na gagamitin:

Sample

<meta charset="UTF-8">

HTML Character Set

Ang spec ng HTML5 ay hinihikayat ang mga web developer na gamitin ang charset na UTF-8!

Subalit hindi palagi ito. Ang character encoding ng naunang Web ay ASCII.

Pagkatapos, mula sa HTML 2.0 hanggang sa HTML 4.01, ang ISO-8859-1 ay itinuturing na standard na charset.

Sa pagkakaroon ng XML at HTML5, ang UTF-8 ay nangunguna at nasolusyunan ang maraming problema sa character encoding.

Sa simula: ASCII

Ang datos ng computer ay inimbak sa elektronikong aparato bilang binarikong code (01000101).

Upang gamitin ang standardisasyon ng pag-iimbak ng teksto, nilikha ang American Standard Code for Information Interchange (ASCII). Ito ay nagtatalaga ng isang natatanging binarang numero para sa bawat mahahahalagang character, upang suportahan ang numero 0-9, malalaking titik at maliit na titik (a-z, A-Z) at mga espesyal na character (tulad ng ! $ + - ( ) @ < > ,).

Dahil ang ASCII ay gumagamit ng 7-bit na character, ito ay puwedeng ipakita lamang ang 128 na iba't ibang character.

Ang pinakamalaking kahinaan ng ASCII ay ito ay pinapalabas ang mga hindi Ingles na alpabeto.

Ngayon, ang ASCII ay patuloy na ginagamit, lalo na sa malalaking sistema ng computer host.

Kung gusto ng mas malalim na pag-aaral, bisitahin ninyo ang aming Kompleto na ASCII reference.

Sa Windows: Windows-1252

Ang Windows-1252 ay ang default charset sa Windows (hanggang sa Windows 95).

Ito ay isang pagpapalawak ng ASCII, na nagdagdag ng mga internasyonal na character.

Ito ay gumagamit ng buong byt (8 na bit) upang ipakita ang 256 na iba't ibang character.

Dahil ang Windows-1252 ay ang default setting sa Windows, lahat ng mga browser ay sumusuporta dito.

Kung gusto ng mas malalim na pag-aaral, bisitahin ninyo ang aming Kompleto na Windows-1252 reference.

Sa HTML 4: ISO-8859-1

Ang pinakamadalas na ginamit na charset sa HTML 4 ay ang ISO-8859-1.

ISO-8859-1 ay isang pagpapalawak ng ASCII, na nagdagdag ng mga internasyonal na character.

Sample

<meta http-equiv="Content-Type" content="text/html;charset=ISO-8859-1">

Sa HTML 4, maaaring itakda ang iba pang charset kaysa ISO-8859-1 sa <meta> tag:

Sample

<meta http-equiv="Content-Type" content="text/html;charset=ISO-8859-8">

Lahat ng HTML 4 processors ay sumusuporta sa UTF-8:

Sample

<meta http-equiv="Content-Type" content="text/html;charset=UTF-8">

Mga tagubilin:Kapag nakita ng browser ang ISO-8859-1, ito ay pangkaraniwang inialamat bilang Windows-1252 dahil ang Windows-1252 ay may 32 pang-internasyonal na character.

Kung gusto ng mas malalim na pag-aaral, bisitahin ninyo ang aming Kompleto na pagkilala sa ISO-8859-1.

Sa HTML5: Unicode UTF-8

Ang estandar ng HTML5 ay hinihikayat ang mga web developer na gamitin ang charset na UTF-8.

Sample

<meta charset="UTF-8">

Maaaring itakda ang iba pang charset kaysa UTF-8 sa <meta> tag:

Sample

<meta charset="ISO-8859-1">

Ang Unicode Consortium ay nagdesenvlope ng mga standard na UTF-8 at UTF-16 dahil ang kalsada ng ISO-8859 ay limitado at hindi nakakasanggunian sa iba't ibang wika na kapaligiran.

Ang estandar ng Unicode (hindi) ay kumakabuha sa lahat ng mga character, marka ng pahintulot at simbolo sa mundo.

Mga tagubilin:Lahat ng HTML5 at XML processors ay sumusuporta sa UTF-8, UTF-16, Windows-1252 at ISO-8859.

Kung gusto ng mas malalim na pag-aaral, bisitahin ninyo ang aming Kompleto na pagkilala sa Unicode.