Quando si sviluppa una pagina web, uno dei problemi più ricorrenti è la corretta gestione del charset (o set di caratteri). Ogni paese ovviamente ha il suo charset e quando un documento html viene scritto (e successivamente interpretato dal browser) dovrebbe utilizzare il charset corretto per evitare "storpiature" durante la visualizzazione della pagina web.

In Italia, o comunque, per la corretta formattazione di documenti in italiano, il set di caratteri da utilizzare è l'ISO-8859-1(Latin 1) che rappresenta anche il set di caratteri tipico dell'Europa Occidentale. Questa codifica contiene ovviamente le lettere dell'alfabeto, i numeri, la punteggiatura e i simboli tipici della nostra cultura (per es. l'€ o il $) ma anche delle altre lingue dell'Europa Occidentale.

Vediamo ora in pratica come definire correttamente il set di caratteri da utilizzare in una pagina HTML:

                        
<meta http-equiv="Content-Type" content="text/html;charset=ISO-8859-1">                
                    

Con questa intestazione dovremmo essere sicuri (ma non al 100%) che gli utenti riusciranno a leggere correttamente il testo scritto nel nostro documento. Questo scarto è dovuto a diversi fattori come per esempio il browser utilizzato o il charset di default del web server che ospita le nostre pagine web.

Per ovviare a ciò è consigliabile sostituire ai caratteri accentati, i simboli o ai caratteri speciali, la corrispondente entità HTML. Attenzione che alcuni caratteri speciali (vedi i primi 5) essendo propri della sintassi dei linguaggi HTML e XHTML potrebbero creare dei problemi nell'output della pagina (in quanto potrebbero essere interpretati invece che semplicemente visualizzati!). Vediamo di seguito quelli più largamente utilizzati:

 Entità testuale   Entità numerica   Simbolo 
&quot; &#34; "
&amp; &#38; &
&apos; &#39; '
&lt; &#60; <
&gt; &#62; >
&nbsp; &#32; (spazio)
&pound; &#163; £
&copy; &#169; ©
&laquo; &#171; «
&reg; &#174; ®
&deg; &#176; °
&raquo; &#187; »
&frac14; &#188; ¼
&frac12; &#189; ½
&frac34; &#190; ¾
&Agrave; &#192; À
&Aacute; &#193; Á
&Acirc; &#194; Â
&Atilde; &#195; Ã
&Auml; &#196; Ä
&Aring; &#197; Å
&AElig; &#198; Æ
&Ccedil; &#199; Ç
&Egrave; &#200; È
&Eacute; &#201; É
&Ecirc; &#202; Ê
&Euml; &#203; Ë
&Igrave; &#204; Ì
&Iacute; &#205; Í
&Icirc; &#206; Î
&Iuml; &#207; Ï
&ETH; &#208; Ð
&Ntilde; &#209; Ñ
&Ograve; &#210; Ò
&Oacute; &#211; Ó
&Ocirc; &#212; Ô
&Otilde; &#213; Õ
&Ouml; &#214; Ö
&times; &#215; ×
&Oslash; &#216; Ø
&Ugrave; &#217; Ù
&Uacute; &#218; Ú
&Ucirc; &#219; Û
&Uuml; &#220; Ü
&Yacute; &#221; Ý
&THORN; &#222; Þ
&szlig; &#223; ß
&agrave; &#224; à
&aacute; &#225; á
&acirc; &#226; â
&atilde; &#227; ã
&auml; &#228; ä
&aring; &#229; å
&aelig; &#230; æ
&ccedil; &#231; ç
&egrave; &#232; è
&eacute; &#233; é
&ecirc; &#234; ê
&euml; &#235; ë
&igrave; &#236; ì
&iacute; &#237; í
&icirc; &#238; î
&iuml; &#239; ï
&eth; &#240; ð
&ntilde; &#241; ñ
&ograve; &#242; ò
&oacute; &#243; ó
&ocirc; &#244; ô
&otilde; &#245; õ
&ouml; &#246; ö
&divide; &#247; ÷
&oslash; &#248; ø
&ugrave; &#249; ù
&uacute; &#250, ú
&ucirc; &#251; û
&uuml; &#252; ü
&yacute; &#253; ý
&thorn; &#254; þ
&yuml; &#255; ÿ