Set di caratteri HTML

Per visualizzare correttamente le pagine HTML, i browser devono sapere quale set di caratteri (codifica) utilizzare:

Esempio

<meta charset="UTF-8">

Set di caratteri HTML

La specifica HTML5 incoraggia i sviluppatori web a utilizzare il set di caratteri UTF-8!

Ma non è sempre stato così. La codifica dei caratteri della prima Web era ASCII.

Successivamente, da HTML 2.0 a HTML 4.01, ISO-8859-1 è stato considerato il set di caratteri standard.

Con XML e HTML5, UTF-8 è finalmente apparso e ha risolto molti problemi di codifica dei caratteri.

All'inizio: ASCII

I dati dei computer vengono memorizzati in codice binario (01000101) negli apparecchi elettronici.

Per standardizzare lo stoccaggio del testo, è stato creato il codice standard americano per l'interscambio delle informazioni (American Standard Code for Information Interchange, ASCII). Definisce un numero binario unico per ogni carattere memorizzabile, per supportare i numeri da 0 a 9, le lettere maiuscole e minuscole (a-z, A-Z) e i caratteri speciali (ad esempio ! $ + - ( ) @ < > ,).

Poiché l'ASCII utilizza caratteri a 7 bit, può rappresentare solo 128 caratteri diversi.

Il principale svantaggio dell'ASCII è che esclude i caratteri non-inglese.

Oggi, l'ASCII è ancora utilizzato, specialmente nei sistemi di computer mainframe.

Per una ricerca più approfondita, visitare il nostro Riferimento completo ASCII.

In Windows: Windows-1252

Windows-1252 è il set di caratteri predefinito in Windows (fino a Windows 95).

È un'estensione dell'ASCII, che include caratteri internazionali.

Utilizza un byte completo (8 bit) per rappresentare 256 caratteri diversi.

Poiché Windows-1252 è la configurazione predefinita in Windows, tutti i browser lo supportano.

Per una ricerca più approfondita, visitare il nostro Riferimento completo Windows-1252.

Nell'HTML 4: ISO-8859-1

Nell'HTML 4, il set di caratteri più utilizzato è ISO-8859-1.

ISO-8859-1 è un'estensione dell'ASCII, che include caratteri internazionali.

Esempio

<meta http-equiv="Content-Type" content="text/html;charset=ISO-8859-1">

In HTML 4, è possibile specificare un set di caratteri diverso da ISO-8859-1 nel tag <meta>:

Esempio

<meta http-equiv="Content-Type" content="text/html;charset=ISO-8859-8">

Tutti i processor HTML 4 supportano anche UTF-8:

Esempio

<meta http-equiv="Content-Type" content="text/html;charset=UTF-8">

Suggerimento:Quando il browser rileva ISO-8859-1, di solito lo considera come Windows-1252, perché Windows-1252 ha altri 32 caratteri internazionali.

Per una ricerca più approfondita, visitare il nostro Completo riferimento ISO-8859-1.

In HTML5: Unicode UTF-8

La specifica HTML5 incoraggia i sviluppatori web a utilizzare il set di caratteri UTF-8.

Esempio

<meta charset="UTF-8">

È possibile specificare un set di caratteri diverso da UTF-8 nel tag <meta>:

Esempio

<meta charset="ISO-8859-1">

L'Unione Unicode ha sviluppato gli standard UTF-8 e UTF-16 perché il set di caratteri ISO-8859 è limitato e non compatibile con l'ambiente multilinguistico.

Lo standard Unicode (quasi) copre tutti i caratteri, i segni di punteggiatura e i simboli del mondo.

Suggerimento:Tutti i processor HTML5 e XML supportano UTF-8, UTF-16, Windows-1252 e ISO-8859.

Per una ricerca più approfondita, visitare il nostro Riferimento completo Unicode.