Quando si sviluppa una pagina web, uno dei problemi più ricorrenti è la
corretta gestione del charset (o set di caratteri). Ogni paese ovviamente ha il suo charset e quando un documento html viene scritto (e successivamente interpretato dal browser) dovrebbe utilizzare il charset corretto per evitare "storpiature" durante la visualizzazione della pagina web.
In Italia, o comunque, per la corretta formattazione di documenti in italiano, il set di caratteri da utilizzare è l'
ISO-8859-1(Latin 1) che rappresenta anche il set di caratteri tipico dell'Europa Occidentale. Questa codifica contiene ovviamente le lettere dell'alfabeto, i numeri, la punteggiatura e i simboli tipici della nostra cultura (per es. l'€ o il $) ma anche delle altre lingue dell'Europa Occidentale.
Vediamo ora in pratica come definire correttamente il set di caratteri da utilizzare in una pagina HTML:
<meta http-equiv="Content-Type" content="text/html;charset=ISO-8859-1">
Con questa intestazione dovremmo essere sicuri (ma non al 100%) che gli utenti riusciranno a leggere correttamente il testo scritto nel nostro documento. Questo scarto è dovuto a diversi fattori come per esempio il browser utilizzato o il charset di default del web server che ospita le nostre pagine web.
Per ovviare a ciò è consigliabile sostituire ai caratteri accentati, i simboli o ai caratteri speciali, la corrispondente entità HTML. Attenzione che alcuni caratteri speciali (vedi i primi 5) essendo propri della sintassi dei linguaggi HTML e XHTML potrebbero creare dei problemi nell'output della pagina (in quanto potrebbero essere interpretati invece che semplicemente visualizzati!). Vediamo di seguito quelli più largamente utilizzati:
| Entità testuale | Entità numerica | Simbolo |
|---|
| " | " | " |
| & | & | & |
| ' | ' | ' |
| < | < | < |
| > | > | > |
| |   | (spazio) |
| £ | £ | £ |
| © | © | © |
| « | « | « |
| ® | ® | ® |
| ° | ° | ° |
| » | » | » |
| ¼ | ¼ | ¼ |
| ½ | ½ | ½ |
| ¾ | ¾ | ¾ |
| À | À | À |
| Á | Á | Á |
| Â | Â | Â |
| Ã | Ã | Ã |
| Ä | Ä | Ä |
| Å | Å | Å |
| Æ | Æ | Æ |
| Ç | Ç | Ç |
| È | È | È |
| É | É | É |
| Ê | Ê | Ê |
| Ë | Ë | Ë |
| Ì | Ì | Ì |
| Í | Í | Í |
| Î | Î | Î |
| Ï | Ï | Ï |
| Ð | Ð | Ð |
| Ñ | Ñ | Ñ |
| Ò | Ò | Ò |
| Ó | Ó | Ó |
| Ô | Ô | Ô |
| Õ | Õ | Õ |
| Ö | Ö | Ö |
| × | × | × |
| Ø | Ø | Ø |
| Ù | Ù | Ù |
| Ú | Ú | Ú |
| Û | Û | Û |
| Ü | Ü | Ü |
| Ý | Ý | Ý |
| Þ | Þ | Þ |
| ß | ß | ß |
| à | à | à |
| á | á | á |
| â | â | â |
| ã | ã | ã |
| ä | ä | ä |
| å | å | å |
| æ | æ | æ |
| ç | ç | ç |
| è | è | è |
| é | é | é |
| ê | ê | ê |
| ë | ë | ë |
| ì | ì | ì |
| í | í | í |
| î | î | î |
| ï | ï | ï |
| ð | ð | ð |
| ñ | ñ | ñ |
| ò | ò | ò |
| ó | ó | ó |
| ô | ô | ô |
| õ | õ | õ |
| ö | ö | ö |
| ÷ | ÷ | ÷ |
| ø | ø | ø |
| ù | ù | ù |
| ú | ú, | ú |
| û | û | û |
| ü | ü | ü |
| ý | ý | ý |
| þ | þ | þ |
| ÿ | ÿ | ÿ |