Codificação HTML (Conjunto de Caracteres)

Para exibir corretamente a página HTML, o navegador da Web deve saber qual conjunto de caracteres usar.

De ASCII para UTF-8

ASCII é o primeiro padrão de codificação de caracteres. ASCII define 128 caracteres que podem ser usados na internet: números (0-9), letras (A-Z) e alguns caracteres especiais, como: ! $ + - ( ) @ < >.

ISO-8859-1 é o conjunto de caracteres padrão do HTML 4. Este conjunto de caracteres suporta 256 diferentes códigos de caracteres. O HTML 4 também suporta UTF-8.

ANSI (Windows-1252) é o conjunto de caracteres original do Windows. ANSI é o mesmo que ISO-8859-1, mas com 32 caracteres adicionais.

O padrão HTML5 incentiva os desenvolvedores da Web a usar o conjunto de caracteres UTF-8, que cobre quase todos os caracteres e símbolos do mundo!

Atributo charset do HTML

Para exibir corretamente a página HTML, o navegador da Web deve saber qual conjunto de caracteres está sendo usado na página.

Isto é <meta> especificado no rótulo:

<meta charset="UTF-8">

Experimente pessoalmente

Diferenças entre os conjuntos de caracteres

A tabela a seguir mostra as diferenças entre os conjuntos de caracteres acima:

Numb ASCII ANSI 8859 UTF-8 Descrição
32 espaço
33!!!!sinal de exclamação
34""""aspas
35####sinal de número
36$$$$sinal de dólar
37%%%%sinal percentual
38&&&&ampersand
39''''apostrophe
40((((left parenthesis
41))))38
&e commercialee commercialee commercialee commerciale'
apóstrofo40404040(
parenteses esquerdo))))parenteses direito
*estrelaestrelaestrelaestrela+
sinal de mais,,,,viração
-hífenhífenhífenhífen.
ponto47474747/
barra484848480
número zero494949491
número um505050502
número dois515151513
número três525252524
número quatro535353535
número cinco545454546
número seis555555557
número sete565656568
número oito575757579
número nove58585858:
ponto59595959;
ponto e vírgula60606060<
sinal de menor que====sinal de igual
>sinal de maior quesinal de maior quesinal de maior quesinal de maior que?
ponto de interrogação64646464@
commercial at65656565A
Letra maiúscula latina ABBBBLetra maiúscula latina B
67CCCCLetra maiúscula latina C
68DDDDLetra maiúscula latina D
69EEEELetra maiúscula latina E
70FFFFLetra maiúscula latina F
71GGGGLetra maiúscula latina G
72HHHHLetra maiúscula latina H
73IIIILetra maiúscula latina I
74JJJJLetra maiúscula latina J
75KKKKLetra maiúscula latina K
76LLLLLetra maiúscula latina L
77MMMMLetra maiúscula latina M
78NNNNLetra maiúscula latina N
79OOOOLetra maiúscula latina O
Latin capital letter MNNNNLatin capital letter N
OLatin capital letter OLatin capital letter OLatin capital letter OLatin capital letter O80
PLatin capital letter PLatin capital letter PLatin capital letter PLatin capital letter P81
QLatin capital letter QLatin capital letter QLatin capital letter QLatin capital letter Q82
RLatin capital letter RLatin capital letter RLatin capital letter RLatin capital letter R83
SLatin capital letter SLatin capital letter SLatin capital letter SLatin capital letter S84
TLatin capital letter TLatin capital letter TLatin capital letter TLatin capital letter T85
ULatin capital letter ULatin capital letter ULatin capital letter ULatin capital letter U86
VLatin capital letter VLatin capital letter VLatin capital letter VLatin capital letter V87
WLatin capital letter WLatin capital letter WLatin capital letter WLatin capital letter W88
XLatin capital letter XLatin capital letter XLatin capital letter XLatin capital letter X89
YLatin capital letter YLatin capital letter YLatin capital letter YLatin capital letter Y90
ZLatin capital letter ZLatin capital letter ZLatin capital letter ZLatin capital letter Z91
[left square bracketleft square bracketleft square bracketleft square bracket\
reverse solidus]]]]right square bracket
^circumflex accentcircumflex accentcircumflex accentcircumflex accent_
low line````grave accent
97aaaaLatin small letter a
98bbbbLatin small letter b
99ccccLatin small letter c
100ddddLatin small letter d
101eeeeLatin small letter e
102ffffLatin small letter f
103ggggLatin small letter g
104hhhhLatin small letter h
105iiiiLatin small letter i
106jjjjLatin small letter j
107kkkkLatin small letter k
108llllLatin small letter l
109mmmmLatin small letter m
110nnnnLatin small letter n
111ooooLatin small letter o
112ppppLatin small letter p
113qqqqLatin small letter q
114rrrrLatin small letter r
115ssssLatin small letter s
116ttttLatin small letter t
117uuuuLatin small letter u
118vvvvLatin small letter v
119wwwwLatin small letter w
120xxxxLatin small letter x
121yyyyLatin small letter y
122zzzzLatin small letter z
123{{{{left curly bracket
124||||vertical line
125}}}}right curly bracket
126˜˜˜˜tilde
127DEL    
128   euro sign
129 aspas angulares pontiagudas para direita
130   single low-9 quotation mark
131   Latin small letter f with hook
132   double low-9 quotation mark
133   horizontal ellipsis
134   dagger
135   double dagger
136   modifier letter circumflex accent
137   per mille sign
138   Latin capital letter S with caron
139   single left-pointing angle quotation mark
140   Latin capital ligature OE
141 aspas angulares pontiagudas para direita
142   Latin capital letter Z with caron
143 aspas angulares pontiagudas para direita
144 aspas angulares pontiagudas para direita
145   left single quotation mark
146   right single quotation mark
147   left double quotation mark
148   right double quotation mark
149 •  bullet
150 –  en dash
151 149  •
ponto 150  –
traço em en —  traço em em
152 ˜  tilde pequena
153 ™  sinal de marca registrada
154 š  letra minúscula latina s com caron
155 ›››aspas angulares pontiagudas para direita
156 œ  ligadura latina minúscula oe
157   não utilizado
158    ž
letra minúscula latina z com caron 159159159Ÿ
letra maiúscula latina Y com trema 160160160espaço que não pode ser quebrado
¡ sinal de exclamação invertidasinal de exclamação invertidasinal de exclamação invertida¢
sinal de centavo £££sinal de libra
¤ sinal de moedasinal de moedasinal de moeda¥
sinal de iene 166166166¦
barra quebrada 167167167§
sinal de seção 168168168¨
trema 169169169©
sinal de direitos autor 170170170ª
indicador ordinal feminino 171171171«
aspas angulares duplas pontiagudas para esquerda 172172172¬
sinal de não ­­­hífen macio
174 ®®®sinal de registro
175 ¯¯¯macrôn
176 °°°sinal de grau
177 ±±±sinal de mais-menos
178 ²²²subscrito dois
179 ³³³subscrito três
180 ´´´acento agudo
181 µµµsinal de micro
182 sinal de pilcro
183 ···ponto médio
184 ¸¸¸cedilha
185 ¹¹¹subscrito um
186 ºººindicador ordinal masculino
187 »»»right-pointing double angle quotation mark
188 187187187»
aspa dupla pontilhada direita 189189189¼
½ ¾¾¾fração simples três quartos
191 ¿¿¿ponto de interrogação invertido
192 ÀÀÀLetra maiúscula latina A com tilde
193 ÁÁÁLetra maiúscula latina A com acuto
194 ÂÂÂLetra maiúscula latina A com circunflexo
195 ÃÃÃLetra maiúscula latina A com tilde
196 ÄÄÄLetra maiúscula latina A com diereseis
197 ÅÅÅLetra maiúscula latina A com anel acima
198 ÆÆÆLetra maiúscula latina AE
199 ÇÇÇLetra maiúscula latina C com cedilha
200 ÈÈÈLetra maiúscula latina E com tilde
201 ÉÉÉLetra maiúscula latina E com acuto
202 ÊÊÊLetra maiúscula latina E com circunflexo
203 ËËËLetra maiúscula latina E com diereseis
204 ÌÌÌLetra maiúscula latina I com tilde
205 ÍÍÍLetra maiúscula latina I com acuto
206 ÎÎÎLetra maiúscula latina I com circunflexo
207 ÏÏÏLetra maiúscula latina I com diereseis
208 ÐÐÐLetra maiúscula latina Eth
209 ÑÑÑLetra maiúscula latina N com tilde
210 ÒÒÒLatin capital letter O with grave
211 ÓÓÓLatin capital letter O with acute
212 ÔÔÔLatin capital letter O with circumflex
213 ÕÕÕLatin capital letter O with tilde
214 ÖÖÖLatin capital letter O with diaeresis
215 ×××multiplication sign
216 ØØØLatin capital letter O with stroke
217 ÙÙÙLatin capital letter U with grave
218 ÚÚÚLatin capital letter U with acute
219 ÛÛÛLatin capital letter U with circumflex
220 ÜÜÜLatin capital letter U with diaeresis
221 ÝÝÝLatin capital letter Y with acute
222 ÞÞÞLatin capital letter Thorn
223 ßßßLatin small letter sharp s
224 àààLatin small letter a with grave
225 áááLatin small letter a with acute
226 âââLatin small letter a with circumflex
227 ãããLatin small letter a with tilde
228 äääLatin small letter a with diaeresis
229 åååLatin small letter a with ring above
230 æææLatin small letter ae
231 çççLatin small letter c with cedilla
232 èèèLatin small letter e with grave
233 éééLetra minúscula latina e com acento agudo
234 êêêLetra minúscula latina e com circunflexão
235 ëëëLetra minúscula latina e com diéresis
236 ìììLetra minúscula latina i com tilde
237 íííLetra minúscula latina i com acento agudo
238 îîîLetra minúscula latina i com circunflexão
239 ïïïLetra minúscula latina i com diéresis
240 ðððLetra minúscula latina eth
241 ñññLetra minúscula latina n com tilde
242 òòòLetra minúscula latina o com tilde
243 óóóLetra minúscula latina o com acento agudo
244 ôôôLetra minúscula latina o com circunflexão
245 õõõLetra minúscula latina o com tilde
246 öööLetra minúscula latina o com diéresis
247 ÷÷÷sinal de divisão
248 øøøLetra minúscula latina o com traço
249 ùùùLetra minúscula latina u com tilde
250 úúúLetra minúscula latina u com acento agudo
251 ûûûLetra minúscula latina com circunflexão
252 üüüLetra minúscula latina u com diéresis
253 ýýýLetra minúscula latina y com acento agudo
254 þþþLetra minúscula latina thorn
255 ÿÿÿLetra minúscula latina y com diéresis

Conjunto de caracteres ASCII

O ASCII usa os valores de 0 a 31 (e 127) como caracteres de controle.

ASCII usa valores de 32 a 126 para representar letras, números e símbolos.

ASCII não usa valores de 128 a 255.

Conjunto de Caracteres ANSI (Windows-1252)

Para os valores de 0 a 127, ANSI é o mesmo que ASCII.

ANSI tem um conjunto de caracteres exclusivos, cujos valores variam de 128 a 159.

Para os valores de 160 a 255, ANSI é o mesmo que UTF-8.

Conjunto de Caracteres ISO-8859-1

Para os valores de 0 a 127, 8859-1 é o mesmo que ASCII.

8859-1 não usa valores de 128 a 159.

Para os valores de 160 a 255, 8859-1 é o mesmo que UTF-8.

Conjunto de Caracteres UTF-8

Para os valores de 0 a 127, UTF-8 é o mesmo que ASCII.

UTF-8 não usa valores de 128 a 159.

Para os valores de 160 a 255, UTF-8 é o mesmo que ANSI e 8859-1.

UTF-8 continua a partir do valor 256, contendo mais de 10000 caracteres diferentes.

Para uma pesquisa mais aprofundada, leia nosso manual completo de conjunto de caracteres do HTML.

Regra @charset do CSS

Você pode usar a regra @charset do CSS para especificar a codificação de caracteres usada na folha de estilo:

Exemplo

Defina a codificação da folha de estilo como Unicode UTF-8:

@charset "UTF-8";

Obtenha mais informações sobre isso em nosso manual de referência do CSS. Regra @charset do CSS do conteúdo.