Pengodean HTML (Sistem Karakter)

Untuk menampilkan halaman HTML dengan benar, peramban web harus mengetahui karakter set yang akan digunakan.

Dari ASCII ke UTF-8

ASCII adalah standar pengkodean karakter pertama. ASCII mendefinisikan 128 karakter yang dapat digunakan di internet: angka (0-9), huruf (A-Z) dan beberapa karakter khusus seperti: ! $ + - ( ) @ < >.

ISO-8859-1 adalah karakter set standar HTML 4. Karakter set ini mendukung 256 kode karakter yang berbeda. HTML 4 juga mendukung UTF-8.

ANSI (Windows-1252) adalah karakter set Windows asli. ANSI sama dengan ISO-8859-1, tetapi dengan tambahan 32 karakter ekstra.

Spesifikasi HTML5 mendorong para pengembang web menggunakan karakter set UTF-8, karakter set yang mencakup hampir semua karakter dan simbol di dunia!

Atribut charset HTML

Untuk menampilkan halaman HTML dengan benar, peramban web harus mengetahui karakter set yang digunakan di halaman.

Ini adalah <meta> dinyatakan di dalam tag:

<meta charset="UTF-8">

Coba sendiri

Perbedaan antara karakter set

Tabel di bawah menunjukkan perbedaan antara karakter set yang disebutkan di atas:

Numb ASCII ANSI 8859 UTF-8 Deskripsi
32 spasi
33!!!!tanda seru
34""""tanda kutip
35####tanda nomor
36$$$$tanda dollar
37%%%%tanda persen
38&&&&ampersand
39''''apostrophe
40((((38
nombor tiga puluh lima&&&&tanda tanda dan
'nombor empat puluhnombor empat puluhnombor empat puluhnombor empat puluh(
tanda kurung kirinombor empat puluh satunombor empat puluh satunombor empat puluh satunombor empat puluh satu)
tanda kurung kanan****tanda asterisk
+tanda plustanda plustanda plustanda plus,
tanda koma----nombor empat puluh enam
.tanda titiktanda titiktanda titiktanda titiknombor tujuh puluh tujuh
/nombor empat puluh delapannombor empat puluh delapannombor empat puluh delapannombor empat puluh delapannombor nol
nombor empat puluh sembilan1111nombor satu
nombor lima puluhnombor lima puluhnombor lima puluhnombor lima puluhnombor lima puluhnombor dua
nombor lima puluh2222nombor lima puluh satu
3nombor tiganombor tiganombor tiganombor tiga4
nombor empat5555nombor lima
nombor empat puluh empat6666nombor enam
nombor lima puluh lima7777nombor tujuh
nombor enam puluh enam8888nombor delapan
57nombor tujuh puluh tujuhnombor tujuh puluh tujuhnombor tujuh puluh tujuhnombor tujuh puluh tujuh9
nombor sembilan58585858:
tanda titik59595959;
tanda koma60606060<
tanda kurang dari61616161=
tanda sama dengan62626262>
tanda lebih besar????tanda tanya
64@@@@tanda komersial
65AAAAHuruf kapital Latin A
66BBBBHuruf kapital Latin B
67CCCCHuruf kapital Latin C
68DDDDHuruf kapital Latin D
69EEEEHuruf kapital Latin E
70FFFFHuruf kapital Latin F
71GGGGHuruf kapital Latin G
72HHHHHuruf kapital Latin H
73IIIIHuruf kapital Latin I
74JJJJHuruf kapital Latin J
75KKKKHuruf kapital Latin K
76LLLLHuruf kapital Latin L
77MMMMHuruf kapital Latin M
78NNNNHuruf kapital Latin N
79OOOOHuruf kapital Latin O
Latin capital letter MNNNNLatin capital letter N
OLatin capital letter OLatin capital letter OLatin capital letter OLatin capital letter O80
PLatin capital letter PLatin capital letter PLatin capital letter PLatin capital letter P81
QLatin capital letter QLatin capital letter QLatin capital letter QLatin capital letter Q82
RLatin capital letter RLatin capital letter RLatin capital letter RLatin capital letter R83
SLatin capital letter SLatin capital letter SLatin capital letter SLatin capital letter S84
TLatin capital letter TLatin capital letter TLatin capital letter TLatin capital letter T85
ULatin capital letter ULatin capital letter ULatin capital letter ULatin capital letter U86
VLatin capital letter VLatin capital letter VLatin capital letter VLatin capital letter V87
WLatin capital letter WLatin capital letter WLatin capital letter WLatin capital letter W88
XLatin capital letter XLatin capital letter XLatin capital letter XLatin capital letter X89
YLatin capital letter YLatin capital letter YLatin capital letter YLatin capital letter Y90
ZLatin capital letter ZLatin capital letter ZLatin capital letter ZLatin capital letter Z91
[left square bracketleft square bracketleft square bracketleft square bracket\
reverse solidus]]]]right square bracket
^circumflex accentcircumflex accentcircumflex accentcircumflex accent_
low line````grave accent
97aaaaLatin small letter a
98bbbbLatin small letter b
99ccccLatin small letter c
100ddddLatin small letter d
101eeeeLatin small letter e
102ffffLatin small letter f
103ggggLatin small letter g
104hhhhLatin small letter h
105iiiiLatin small letter i
106jjjjLatin small letter j
107kkkkLatin small letter k
108llllLatin small letter l
109mmmmLatin small letter m
110nnnnLatin small letter n
111ooooLatin small letter o
112ppppLatin small letter p
113qqqqLatin small letter q
114114114114114r
Latin small letter r115115115115s
Latin small letter s116116116116t
Latin small letter t117117117117u
Latin small letter u118118118118v
Latin small letter v119119119119w
Latin small letter w120120120120x
Latin small letter x121121121121y
Latin small letter y122122122122z
Latin small letter z123123123123{
left curly bracket||||vertical line
125}}}}right curly bracket
126~~~~tilde
127DEL    
128 €  euro sign
129 ›
130 ‚  single low-9 quotation mark
131 ƒ  Latin small letter f with hook
132 „  double low-9 quotation mark
133 …  horizontal ellipsis
134 †  dagger
135 ‡  double dagger
136 ˆ  modifier letter circumflex accent
137 ‰  per mille sign
138 Š  Latin capital letter S with caron
139 ‹  single left-pointing angle quotation mark
140 Œ  Latin capital ligature OE
141 ›
142 Ž  Latin capital letter Z with caron
143 ›
144 ›
145 ‘  left single quotation mark
146 ’  right single quotation mark
147 “  left double quotation mark
148 ”  right double quotation mark
149 •  bullet
150 –  en dash
151 —  em dash
 •  tanda tanda titik
– tanda en dash  —
tanda em dash 151  ˜
tilde kecil 153  ™
tanda merk dagang 154  š
huruf kecil Latin s dengan caron 155155155›
tanda petik tanda panah kanan tunggal 156  œ
huruf kecil Latin ligatur oe 157  
NOT USED    ž
huruf kecil Latin z dengan caron 159159159Ÿ
huruf kapital Latin Y dengan diaeresis 160160160spasi tak terputus
¡ tanda tanda seru kembalitanda tanda seru kembalitanda tanda seru kembali¢
tanda mata uang Amerika Serikat £££tanda mata uang Inggris
¤ tanda mata uangtanda mata uangtanda mata uang¥
tanda mata uang Jepang 166166166¦
bar rusak 167167167§
tanda bagian 168168168¨
diaeresis 169169169©
tanda hak cipta 170170170ª
indikator ordinal perempuan 171171171«
petik tanda panah kiri ganda 172172172¬
tanda tidak ­­­hyphen lembut
174 ®®®tanda registrasi
175 ¯¯¯macron
176 °°°tanda derajat
177 ±±±tanda plus-minus
178 ²²²suku dua
179 ³³³suku tiga
180 ´´´tanda akut
181 µµµtanda mikro
182 tanda pilkrow
183 ···titik tengah
184 ¸¸¸cedilla
185 ¹¹¹suku satu
186 ºººindikator ordinal lelaki
187 »»»187
» petik garis lurus ke kananpetik garis lurus ke kananpetik garis lurus ke kanan188
¼ fraksi umum sepertigafraksi umum sepertigafraksi umum sepertiga½
fraksi umum setengah ¾¾¾fraksi umum sepertiga
191 ¿¿¿tanda tanya terbalik
192 ÀÀÀHuruf kapital Latin dengan tanda serupa
193 ÁÁÁHuruf kapital Latin dengan akut
194 ÂÂÂHuruf kapital Latin dengan akut
195 ÃÃÃHuruf kapital Latin dengan tilde
196 ÄÄÄHuruf kapital Latin dengan diaeresis
197 ÅÅÅHuruf kapital Latin dengan lingkaran di atas
198 ÆÆÆHuruf kapital Latin dengan AE
199 ÇÇÇHuruf kapital Latin dengan cedilla
200 ÈÈÈHuruf kapital Latin dengan tanda serupa
201 ÉÉÉHuruf kapital Latin dengan akut
202 ÊÊÊHuruf kapital Latin dengan akut
203 ËËËHuruf kapital Latin dengan diaeresis
204 ÌÌÌHuruf kapital Latin dengan tanda serupa
205 ÍÍÍHuruf kapital Latin dengan akut
206 ÎÎÎHuruf kapital Latin dengan akut
207 ÏÏÏHuruf kapital Latin dengan diaeresis
208 ÐÐÐHuruf kapital Latin dengan Eth
209 ÑÑÑHuruf kapital Latin dengan tilde
210 ÒÒÒLatin capital letter O with grave
211 ÓÓÓLatin capital letter O with acute
212 ÔÔÔLatin capital letter O with circumflex
213 ÕÕÕLatin capital letter O with tilde
214 ÖÖÖLatin capital letter O with diaeresis
215 ×××multiplication sign
216 ØØØLatin capital letter O with stroke
217 ÙÙÙLatin capital letter U with grave
218 ÚÚÚLatin capital letter U with acute
219 ÛÛÛLatin capital letter U with circumflex
220 ÜÜÜLatin capital letter U with diaeresis
221 ÝÝÝLatin capital letter Y with acute
222 ÞÞÞLatin capital letter Thorn
223 ßßßLatin small letter sharp s
224 àààLatin small letter a with grave
225 áááLatin small letter a with acute
226 âââLatin small letter a with circumflex
227 ãããLatin small letter a with tilde
228 äääLatin small letter a with diaeresis
229 åååLatin small letter a with ring above
230 æææLatin small letter ae
231 çççLatin small letter c with cedilla
232 èèèLatin small letter e with grave
233 233233233é
Huruf kecil Latin e dengan akut 234234234ê
Huruf kecil Latin e dengan akut 235235235ë
Huruf kecil Latin e dengan diaresis 236236236ì
Huruf kecil Latin i dengan tombol 237237237í
Huruf kecil Latin i dengan akut 238238238î
Huruf kecil Latin i dengan akut 239239239ï
Huruf kecil Latin i dengan diaresis 240240240ð
Huruf kecil Latin eth 241241241ñ
Huruf kecil Latin n dengan tilde 242242242ò
Huruf kecil Latin o dengan tombol 243243243ó
Huruf kecil Latin o dengan akut 244244244ô
Huruf kecil Latin o dengan akut 245245245õ
Huruf kecil Latin o dengan tilde 246246246ö
Huruf kecil Latin o dengan diaresis 247247247÷
division sign øøøHuruf kecil Latin o dengan garis
249 ùùùHuruf kecil Latin u dengan tombol
250 úúúHuruf kecil Latin u dengan akut
251 ûûûHuruf kecil Latin dengan akut
252 üüüHuruf kecil Latin u dengan diaresis
253 ýýýHuruf kecil Latin y dengan akut
254 þþþHuruf kecil Latin thorn
255 ÿÿÿHuruf kecil Latin y dengan diaresis

Set Karakter ASCII

ASCII menggunakan nilai antara 0 sampai 31 (dan 127) sebagai karakter kontrol.

ASCII menggunakan nilai antara 32 hingga 126 untuk mewakili huruf, angka, dan simbol.

ASCII tidak menggunakan nilai antara 128 hingga 255.

Karakter set ANSI (Windows-1252)

Untuk nilai antara 0 hingga 127, ANSI sama dengan ASCII.

ANSI memiliki kelompok karakter khusus, nilai mereka dari 128 hingga 159.

Untuk nilai antara 160 hingga 255, ANSI sama dengan UTF-8.

Karakter set ISO-8859-1

Untuk nilai antara 0 hingga 127, 8859-1 sama dengan ASCII.

8859-1 tidak menggunakan nilai antara 128 hingga 159.

Untuk nilai antara 160 hingga 255, 8859-1 sama dengan UTF-8.

Karakter set UTF-8

Untuk nilai antara 0 hingga 127, UTF-8 sama dengan ASCII.

UTF-8 tidak menggunakan nilai antara 128 hingga 159.

Untuk nilai antara 160 hingga 255, UTF-8 sama dengan ANSI dan 8859-1.

UTF-8 melanjutkan dari nilai 256, mengandung lebih dari 10000 karakter yang berbeda.

Untuk menggali lebih mendalam, baca panduan referensi lengkap karakter set HTML kami.

Aturan @charset CSS

Anda dapat menggunakan aturan @charset CSS untuk menentukan enkoding karakter yang digunakan dalam tabel gaya:

Contoh

Atur enkoding tabel gaya menjadi Unicode UTF-8:

@charset "UTF-8";

Dapatkan lebih banyak informasi tentang Aturan @charset CSS isi.