Set di caratteri HTML
- Pagina precedente Set di caratteri HTML
- Pagina successiva ASCII HTML
Per visualizzare correttamente le pagine HTML, i browser devono sapere quale set di caratteri (codifica) utilizzare:
Esempio
<meta charset="UTF-8">
Set di caratteri HTML
La specifica HTML5 incoraggia i sviluppatori web a utilizzare il set di caratteri UTF-8!
Ma non è sempre stato così. La codifica dei caratteri della prima Web era ASCII.
Successivamente, da HTML 2.0 a HTML 4.01, ISO-8859-1 è stato considerato il set di caratteri standard.
Con XML e HTML5, UTF-8 è finalmente apparso e ha risolto molti problemi di codifica dei caratteri.
All'inizio: ASCII
I dati dei computer vengono memorizzati in codice binario (01000101) negli apparecchi elettronici.
Per standardizzare lo stoccaggio del testo, è stato creato il codice standard americano per l'interscambio delle informazioni (American Standard Code for Information Interchange, ASCII). Definisce un numero binario unico per ogni carattere memorizzabile, per supportare i numeri da 0 a 9, le lettere maiuscole e minuscole (a-z, A-Z) e i caratteri speciali (ad esempio ! $ + - ( ) @ < > ,).
Poiché l'ASCII utilizza caratteri a 7 bit, può rappresentare solo 128 caratteri diversi.
Il principale svantaggio dell'ASCII è che esclude i caratteri non-inglese.
Oggi, l'ASCII è ancora utilizzato, specialmente nei sistemi di computer mainframe.
Per una ricerca più approfondita, visitare il nostro Riferimento completo ASCII.
In Windows: Windows-1252
Windows-1252 è il set di caratteri predefinito in Windows (fino a Windows 95).
È un'estensione dell'ASCII, che include caratteri internazionali.
Utilizza un byte completo (8 bit) per rappresentare 256 caratteri diversi.
Poiché Windows-1252 è la configurazione predefinita in Windows, tutti i browser lo supportano.
Per una ricerca più approfondita, visitare il nostro Riferimento completo Windows-1252.
Nell'HTML 4: ISO-8859-1
Nell'HTML 4, il set di caratteri più utilizzato è ISO-8859-1.
ISO-8859-1 è un'estensione dell'ASCII, che include caratteri internazionali.
Esempio
<meta http-equiv="Content-Type" content="text/html;charset=ISO-8859-1">
In HTML 4, è possibile specificare un set di caratteri diverso da ISO-8859-1 nel tag <meta>:
Esempio
<meta http-equiv="Content-Type" content="text/html;charset=ISO-8859-8">
Tutti i processor HTML 4 supportano anche UTF-8:
Esempio
<meta http-equiv="Content-Type" content="text/html;charset=UTF-8">
Suggerimento:Quando il browser rileva ISO-8859-1, di solito lo considera come Windows-1252, perché Windows-1252 ha altri 32 caratteri internazionali.
Per una ricerca più approfondita, visitare il nostro Completo riferimento ISO-8859-1.
In HTML5: Unicode UTF-8
La specifica HTML5 incoraggia i sviluppatori web a utilizzare il set di caratteri UTF-8.
Esempio
<meta charset="UTF-8">
È possibile specificare un set di caratteri diverso da UTF-8 nel tag <meta>:
Esempio
<meta charset="ISO-8859-1">
L'Unione Unicode ha sviluppato gli standard UTF-8 e UTF-16 perché il set di caratteri ISO-8859 è limitato e non compatibile con l'ambiente multilinguistico.
Lo standard Unicode (quasi) copre tutti i caratteri, i segni di punteggiatura e i simboli del mondo.
Suggerimento:Tutti i processor HTML5 e XML supportano UTF-8, UTF-16, Windows-1252 e ISO-8859.
Per una ricerca più approfondita, visitare il nostro Riferimento completo Unicode.
- Pagina precedente Set di caratteri HTML
- Pagina successiva ASCII HTML