Conjunto de caracteres HTML
- Página anterior Conjunto de caracteres HTML
- Página siguiente ASCII HTML
Para mostrar correctamente la página HTML, el navegador debe saber qué conjunto de caracteres (codificación) se debe usar:
Ejemplo
<meta charset="UTF-8">
Conjunto de caracteres HTML
El estándar HTML5 alienta a los desarrolladores web a usar el conjunto de caracteres UTF-8!
Sin embargo, no siempre ha sido así. La codificación de caracteres de la primera Web era ASCII.
Más tarde, desde HTML 2.0 hasta HTML 4.01, ISO-8859-1 se consideró el conjunto de caracteres estándar.
Con XML y HTML5, UTF-8 finalmente apareció y resolvió muchos problemas de codificación de caracteres.
Inicialmente: ASCII
Los datos de computadora se almacenan en dispositivos electrónicos en códigos binarios (01000101).
Para estandarizar el almacenamiento de texto, se creó el Código de Intercambio de Información Estándar de América (American Standard Code for Information Interchange, ASCII), que define un número binario único para cada carácter almacenable, para soportar números entre 0 y 9, letras mayúsculas y minúsculas (a-z, A-Z) y caracteres especiales (como ! $ + - ( ) @ < > ,).
Dado que ASCII utiliza caracteres de 7 bits, solo puede representar 128 caracteres diferentes.
La mayor desventaja de ASCII es que excluye caracteres no alfabéticos.
Hoy en día, ASCII sigue siendo utilizado, especialmente en sistemas de computadoras grandes y mainframe.
Para una investigación más profunda, visite nuestra Referencia completa de ASCII.
En Windows: Windows-1252
Windows-1252 es el conjunto de caracteres predeterminado en Windows (hasta Windows 95).
Es una extensión de ASCII, que añade caracteres internacionales.
Usa un byte completo (8 bits) para representar 256 caracteres diferentes.
Dado que Windows-1252 es la configuración predeterminada en Windows, todos los navegadores lo soportan.
Para una investigación más profunda, visite nuestra Referencia completa de Windows-1252.
En HTML 4: ISO-8859-1
El conjunto de caracteres más utilizado en HTML 4 es ISO-8859-1.
ISO-8859-1 es una extensión de ASCII, que añade caracteres internacionales.
Ejemplo
<meta http-equiv="Content-Type" content="text/html;charset=ISO-8859-1">
En HTML 4, se puede especificar un conjunto de caracteres diferente de ISO-8859-1 en la etiqueta <meta>:
Ejemplo
<meta http-equiv="Content-Type" content="text/html;charset=ISO-8859-8">
Todos los procesadores de HTML 4 también admiten UTF-8:
Ejemplo
<meta http-equiv="Content-Type" content="text/html;charset=UTF-8">
Consejo:Cuando el navegador detecta ISO-8859-1, generalmente lo configura como Windows-1252, porque Windows-1252 tiene 32 caracteres internacionales adicionales.
Para una investigación más profunda, visite nuestra Referencia completa de ISO-8859-1.
En HTML5: Unicode UTF-8
El estándar HTML5 alienta a los desarrolladores web a usar el conjunto de caracteres UTF-8.
Ejemplo
<meta charset="UTF-8">
Se puede especificar un conjunto de caracteres diferente de UTF-8 en la etiqueta <meta>:
Ejemplo
<meta charset="ISO-8859-1">
La Unión Unicode desarrolló los estándares UTF-8 y UTF-16 porque el conjunto de caracteres ISO-8859 está limitado y no es compatible con entornos multilingües.
El estándar Unicode (casi) abarca todos los caracteres, signos y símbolos del mundo.
Consejo:Todos los procesadores de HTML5 y XML admiten UTF-8, UTF-16, Windows-1252 e ISO-8859.
Para una investigación más profunda, visite nuestra Referencia completa de Unicode.
- Página anterior Conjunto de caracteres HTML
- Página siguiente ASCII HTML