Bentuk Karakter HTML

Untuk menampilkan halaman HTML dengan benar, peramban harus tahu pakta karakter (kode) yang digunakan:

Contoh

<meta charset="UTF-8">

Bentuk Karakter HTML

Spesifikasi HTML5 mendorong para pengembang web menggunakan pakta karakter UTF-8!

Namun bukan selalu begitu. Pengkodean karakter awal Web adalah ASCII.

Kemudian, dari HTML 2.0 sampai HTML 4.01, ISO-8859-1 dianggap sebagai pakta karakter standar.

Dengan XML dan HTML5, UTF-8 akhirnya muncul dan memecahkan banyak masalah pengkodean karakter.

Awalnya: ASCII

Data komputer disimpan dalam kode biner (01000101) di perangkat elektronik.

Untuk mempermudah penyimpanan teks, kode standar penggantian informasi Amerika (American Standard Code for Information Interchange, ASCII) diciptakan. Ia mendefinisikan angka biner unik untuk setiap karakter yang dapat disimpan untuk mendukung angka 0-9, huruf besar dan kecil (a-z, A-Z) serta karakter khusus (seperti ! $ + - ( ) @ < > ,).

Karena ASCII menggunakan 7 bit karakter, ia hanya dapat menunjukkan 128 karakter yang berbeda.

Tidak kekurangan terbesar ASCII adalah ia mengecualikan huruf yang bukan huruf Inggris.

Sekarang ini, ASCII masih digunakan, khususnya di sistem komputer pelayan besar.

Untuk penelitian yang lebih mendalam, kunjungi Referensi penuh ASCII.

Di Windows: Windows-1252

Windows-1252 adalah pakta karakter baku di Windows (sampai Windows 95).

Ia adalah ekspansi ASCII, menambahkan karakter internasional.

Ia menggunakan satu byte penuh (8 bit) untuk menunjukkan 256 karakter yang berbeda.

Karena Windows-1252 adalah pengaturan baku di Windows, seluruh peramban mendukungnya.

Untuk penelitian yang lebih mendalam, kunjungi Referensi penuh Windows-1252.

Dalam HTML 4: ISO-8859-1

Pakta karakter yang paling sering digunakan dalam HTML 4 adalah ISO-8859-1.

ISO-8859-1 adalah ekspansi ASCII, menambahkan karakter internasional.

Contoh

<meta http-equiv="Content-Type" content="text/html;charset=ISO-8859-1">

Dalam HTML 4, dapat ditentukan set karakter yang berbeda dari ISO-8859-1 di dalam tag <meta>:

Contoh

<meta http-equiv="Content-Type" content="text/html;charset=ISO-8859-8">

Semua pemroses HTML 4 juga mendukung UTF-8:

Contoh

<meta http-equiv="Content-Type" content="text/html;charset=UTF-8">

Petunjuk:Ketika browser mendeteksi ISO-8859-1, ia biasanya mengatur default ke Windows-1252, karena Windows-1252 masih memiliki 32 karakter internasional.

Untuk penelitian yang lebih mendalam, kunjungi Referensi Lengkap ISO-8859-1.

Dalam HTML5: Unicode UTF-8

Spesifikasi HTML5 mendorong para pengembang Web untuk menggunakan set karakter UTF-8.

Contoh

<meta charset="UTF-8">

Dapat ditentukan set karakter yang berbeda dari UTF-8 di dalam tag <meta>:

Contoh

<meta charset="ISO-8859-1">

Persekutuan Unicode mengembangkan standar UTF-8 dan UTF-16 karena set karakter ISO-8859 terbatas dan tidak kompatibel dengan lingkungan berbagai bahasa.

Standar Unicode (hampir) mencakup semua karakter, tanda baca, dan simbol di dunia.

Petunjuk:Semua pemroses HTML5 dan XML mendukung UTF-8, UTF-16, Windows-1252, dan ISO-8859.

Untuk penelitian yang lebih mendalam, kunjungi Referensi Unicode Lengkap.