Quando si sviluppa una pagina web, uno dei problemi più ricorrenti è la corretta gestione del charset
(o set di caratteri). Ogni paese ovviamente ha il suo charset e quando un documento html viene scritto
(e successivamente interpretato dal browser) dovrebbe utilizzare il charset corretto per evitare "storpiature" durante
la visualizzazione della pagina web.
In Italia, o comunque, per la corretta formattazione di documenti in italiano, il set di caratteri da utilizzare è
l'ISO-8859-1(Latin 1) che rappresenta anche il set di caratteri tipico dell'Europa Occidentale.
Questa codifica contiene ovviamente le lettere dell'alfabeto, i numeri, la punteggiatura e i simboli tipici della nostra
cultura (per es. l'€ o il $) ma anche delle altre lingue dell'Europa Occidentale.
Vediamo ora in pratica come definire correttamente il set di caratteri da utilizzare in una pagina HTML:
<meta http-equiv="Content-Type" content="text/html;charset=ISO-8859-1">
Con questa intestazione dovremmo essere sicuri (ma non al 100%) che gli utenti riusciranno a leggere correttamente il testo
scritto nel nostro documento. Questo scarto è dovuto a diversi fattori come per esempio il browser utilizzato o il charset di
default del web server che ospita le nostre pagine web.
Per ovviare a ciò è consigliabile sostituire ai caratteri accentati, i simboli o ai caratteri speciali, la corrispondente
entità HTML. Attenzione che alcuni caratteri speciali (vedi i primi 5) essendo propri della sintassi dei linguaggi HTML
e XHTML potrebbero creare dei problemi nell'output della pagina (in quanto potrebbero essere interpretati invece che
semplicemente visualizzati!). Vediamo di seguito quelli più largamente utilizzati:
Entità testuale |
Entità numerica |
Simbolo |
" |
" |
" |
& |
& |
& |
' |
' |
' |
< |
< |
< |
> |
> |
> |
|
  |
(spazio) |
£ |
£ |
£ |
© |
© |
© |
« |
« |
« |
® |
® |
® |
° |
° |
° |
» |
» |
» |
¼ |
¼ |
¼ |
½ |
½ |
½ |
¾ |
¾ |
¾ |
À |
À |
À |
Á |
Á |
Á |
 |
 |
 |
à |
à |
à |
Ä |
Ä |
Ä |
Å |
Å |
Å |
Æ |
Æ |
Æ |
Ç |
Ç |
Ç |
È |
È |
È |
É |
É |
É |
Ê |
Ê |
Ê |
Ë |
Ë |
Ë |
Ì |
Ì |
Ì |
Í |
Í |
Í |
Î |
Î |
Î |
Ï |
Ï |
Ï |
Ð |
Ð |
Ð |
Ñ |
Ñ |
Ñ |
Ò |
Ò |
Ò |
Ó |
Ó |
Ó |
Ô |
Ô |
Ô |
Õ |
Õ |
Õ |
Ö |
Ö |
Ö |
× |
× |
× |
Ø |
Ø |
Ø |
Ù |
Ù |
Ù |
Ú |
Ú |
Ú |
Û |
Û |
Û |
Ü |
Ü |
Ü |
Ý |
Ý |
Ý |
Þ |
Þ |
Þ |
ß |
ß |
ß |
à |
à |
à |
á |
á |
á |
â |
â |
â |
ã |
ã |
ã |
ä |
ä |
ä |
å |
å |
å |
æ |
æ |
æ |
ç |
ç |
ç |
è |
è |
è |
é |
é |
é |
ê |
ê |
ê |
ë |
ë |
ë |
ì |
ì |
ì |
í |
í |
í |
î |
î |
î |
ï |
ï |
ï |
ð |
ð |
ð |
ñ |
ñ |
ñ |
ò |
ò |
ò |
ó |
ó |
ó |
ô |
ô |
ô |
õ |
õ |
õ |
ö |
ö |
ö |
÷ |
÷ |
÷ |
ø |
ø |
ø |
ù |
ù |
ù |
ú |
ú, |
ú |
û |
û |
û |
ü |
ü |
ü |
ý |
ý |
ý |
þ |
þ |
þ |
ÿ |
ÿ |
ÿ |