Ensemble de caractères HTML
- Page précédente Ensemble de caractères HTML
- Page suivante ASCII HTML
Pour afficher correctement les pages HTML, les navigateurs doivent savoir quel jeu de caractères (encodage) utiliser :
Exemple
<meta charset="UTF-8">
Ensemble de caractères HTML
Le规范 de HTML5 encourage les développeurs web à utiliser le jeu de caractères UTF-8 !
Cependant, ce n'était pas toujours le cas. Le codage des caractères des premières versions du Web était ASCII.
Plus tard, de HTML 2.0 à HTML 4.01, ISO-8859-1 a été considéré comme le jeu de caractères standard.
Avec XML et HTML5, UTF-8 est enfin apparu et a résolu de nombreux problèmes de codage des caractères.
Au début : ASCII
Les données informatiques sont stockées sous forme de code binaire (01000101) dans les appareils électroniques.
Pour standardiser le stockage des textes, le Code Américain Standard pour l'Échange d'Information (American Standard Code for Information Interchange, ASCII) a été créé. Il définit un nombre binaire unique pour chaque caractère stockable, pour les chiffres de 0 à 9, les lettres majuscules et minuscules (a-z, A-Z) ainsi que les caractères spéciaux (comme ! $ + - ( ) @ < > ,).
Comme l'ASCII utilise 7 bits de caractères, il ne peut représenter que 128 caractères différents.
La plus grande faiblesse de l'ASCII est qu'il exclut les lettres non-anglaises.
Aujourd'hui, l'ASCII est toujours utilisé, en particulier dans les systèmes informatiques de grandes machines centrales.
Pour une étude plus approfondie, veuillez visiter notre Référence complète de l'ASCII.
Dans Windows : Windows-1252
Windows-1252 est le jeu de caractères par défaut dans Windows (jusqu'à Windows 95).
C'est une extension de l'ASCII, ajoutant des caractères internationaux.
Il utilise un octet complet (8 bits) pour représenter 256 caractères différents.
Comme Windows-1252 est le réglage par défaut dans Windows, tous les navigateurs le supportent.
Pour une étude plus approfondie, veuillez visiter notre Référence complète de Windows-1252.
Dans HTML 4 : ISO-8859-1
Le jeu de caractères le plus couramment utilisé dans HTML 4 est ISO-8859-1.
ISO-8859-1 est une extension de l'ASCII, ajoutant des caractères internationaux.
Exemple
<meta http-equiv="Content-Type" content="text/html;charset=ISO-8859-1">
Dans HTML 4, vous pouvez spécifier un jeu de caractères différent de ISO-8859-1 dans l'étiquette <meta> :
Exemple
<meta http-equiv="Content-Type" content="text/html;charset=ISO-8859-8">
Tous les processeurs HTML 4 supportent également UTF-8 :
Exemple
<meta http-equiv="Content-Type" content="text/html;charset=UTF-8">
Astuce :Lorsque le navigateur détecte ISO-8859-1, il le met généralement par défaut en Windows-1252, car Windows-1252 contient également 32 caractères internationaux.
Pour une étude plus approfondie, veuillez visiter notre Référence complète ISO-8859-1.
Dans HTML5 : Unicode UTF-8
La norme HTML5 encourage les développeurs Web à utiliser le jeu de caractères UTF-8.
Exemple
<meta charset="UTF-8">
Vous pouvez spécifier un jeu de caractères différent de UTF-8 dans l'étiquette <meta> :
Exemple
<meta charset="ISO-8859-1">
L'Union Unicode a développé les normes UTF-8 et UTF-16, car le jeu de caractères ISO-8859 est limité et n'est pas compatible avec des environnements multilingues.
La norme Unicode (presque) couvre tous les caractères, points de suspension et symboles du monde.
Astuce :Tous les processeurs HTML5 et XML supportent UTF-8, UTF-16, Windows-1252 et ISO-8859.
Pour une étude plus approfondie, veuillez visiter notre Référence Unicode complète.
- Page précédente Ensemble de caractères HTML
- Page suivante ASCII HTML