Sistem Abjad HTML

Untuk menampilkan halaman HTML dengan benar, peramban harus mengetahui kumpulan karakter (enkoding) yang digunakan:

Contoh

<meta charset="UTF-8">

Sistem Abjad HTML

Spesifikasi HTML5 mendorong para pengembang web menggunakan kumpulan karakter UTF-8!

Namun bukan selalu seperti itu. Pada awal Web, pengkodean karakter adalah ASCII.

Kemudian, dari HTML 2.0 hingga HTML 4.01, ISO-8859-1 dianggap sebagai kumpulan karakter standar.

Dengan XML dan HTML5, UTF-8 akhirnya muncul dan menyelesaikan banyak masalah pengkodean karakter.

Awalnya: ASCII

Data komputer disimpan dalam kode biner (01000101) di perangkat elektronik.

Untuk mengharapkan standarisasi penyimpanan teks, didefinisikan Kode Standar Penggantian Informasi Amerika (American Standard Code for Information Interchange, ASCII). Ia mendefinisikan bilangan biner unik bagi setiap karakter yang dapat disimpan untuk mendukung angka 0-9, huruf besar dan kecil (a-z, A-Z) serta karakter khusus (seperti ! $ + - ( ) @ < > ,).

Karena ASCII menggunakan 7 bit karakter, ia hanya dapat menunjukkan 128 karakter yang berbeda.

Kurangnya ASCII adalah ia mengecualikan huruf non-Inggris.

Sekarang ini, ASCII masih digunakan, khususnya di sistem komputer super besar.

Untuk kajian yang lebih mendalam, lawati Rujukan penuh ASCII.

Dalam Windows: Windows-1252

Windows-1252 adalah kumpulan karakter baku di Windows (sampai Windows 95).

Ia adalah ekspansi ASCII, menambahkan karakter internasional.

Ia menggunakan satu byte penuh (8 bit) untuk menunjukkan 256 karakter yang berbeda.

Karena Windows-1252 adalah pengaturan baku di Windows, semua peramban mendukungnya.

Untuk kajian yang lebih mendalam, lawati Rujukan penuh Windows-1252.

Dalam HTML 4: ISO-8859-1

Kumpulan karakter yang paling sering digunakan dalam HTML 4 adalah ISO-8859-1.

ISO-8859-1 adalah ekspansi ASCII, menambahkan karakter internasional.

Contoh

<meta http-equiv="Content-Type" content="text/html;charset=ISO-8859-1">

Dalam HTML 4, dapat ditentukan sistem abjad yang berbeda daripada ISO-8859-1 di dalam tag <meta>:

Contoh

<meta http-equiv="Content-Type" content="text/html;charset=ISO-8859-8">

Semua pemroses HTML 4 juga mendukung UTF-8:

Contoh

<meta http-equiv="Content-Type" content="text/html;charset=UTF-8">

Petunjuk:Ketika peramban mendeteksi ISO-8859-1, ia biasanya mengambil Windows-1252 secara default, karena Windows-1252 masih memiliki 32 karakter internasional.

Untuk kajian yang lebih mendalam, lawati Rujukan Lengkap ISO-8859-1.

Dalam HTML5: Unicode UTF-8

Spesifikasi HTML5 mendorong para pengembang web untuk menggunakan sistem abjad UTF-8.

Contoh

<meta charset="UTF-8">

Dapat ditentukan sistem abjad yang berbeda daripada UTF-8 di dalam tag <meta>:

Contoh

<meta charset="ISO-8859-1">

Persekutuan Unicode mengembangkan standar UTF-8 dan UTF-16 karena set karakter ISO-8859 terbatas dan tak kompatibel dengan lingkungan multibahasa.

Standard Unicode (hampir) meliputi semua karakter, tanda baca, dan simbol di dunia.

Petunjuk:Semua pemroses HTML5 dan XML mendukung UTF-8, UTF-16, Windows-1252, dan ISO-8859.

Untuk kajian yang lebih mendalam, lawati Rujukan Unicode Lengkap.