GESTIRE IL CHARSET ISO 8859-1 DI UNA PAGINA WEB


Quando si sviluppa una pagina web, uno dei problemi più ricorrenti è la corretta gestione del charset (o set di caratteri). Ogni paese ovviamente ha il suo charset e quando un documento html viene scritto (e successivamente interpretato dal browser) dovrebbe utilizzare il charset corretto per evitare "storpiature" durante la visualizzazione della pagina web.

In Italia, o comunque, per la corretta formattazione di documenti in italiano, il set di caratteri da utilizzare è l' ISO-8859-1(Latin 1) che rappresenta anche il set di caratteri tipico dell'Europa Occidentale. Questa codifica contiene ovviamente le lettere dell'alfabeto, i numeri, la punteggiatura e i simboli tipici della nostra cultura (per es. l'€ o il $) ma anche delle altre lingue dell'Europa Occidentale.

Vediamo ora in pratica come definire correttamente il set di caratteri da utilizzare in una pagina HTML:
<meta http-equiv="Content-Type" content="text/html;charset=ISO-8859-1">                

Con questa intestazione dovremmo essere sicuri (ma non al 100%) che gli utenti riusciranno a leggere correttamente il testo scritto nel nostro documento. Questo scarto è dovuto a diversi fattori come per esempio il browser utilizzato o il charset di default del web server che ospita le nostre pagine web.
Per ovviare a ciò è consigliabile sostituire ai caratteri accentati, i simboli o ai caratteri speciali, la corrispondente entità HTML. Attenzione che alcuni caratteri speciali (vedi i primi 5) essendo propri della sintassi dei linguaggi HTML e XHTML potrebbero creare dei problemi nell'output della pagina (in quanto potrebbero essere interpretati invece che semplicemente visualizzati!). Vediamo di seguito quelli più largamente utilizzati:

Entità testuale Entità numerica Simbolo
&quot;&#34;"
&amp;&#38;&
&apos;&#39;'
&lt;&#60;<
&gt;&#62;>
&nbsp;&#32;(spazio)
&pound;&#163;£
&copy;&#169;©
&laquo;&#171;«
&reg;&#174;®
&deg;&#176;°
&raquo;&#187;»
&frac14;&#188;¼
&frac12;&#189;½
&frac34;&#190;¾
&Agrave;&#192;À
&Aacute;&#193;Á
&Acirc;&#194;Â
&Atilde;&#195;Ã
&Auml;&#196;Ä
&Aring;&#197;Å
&AElig;&#198;Æ
&Ccedil;&#199;Ç
&Egrave;&#200;È
&Eacute;&#201;É
&Ecirc;&#202;Ê
&Euml;&#203;Ë
&Igrave;&#204;Ì
&Iacute;&#205;Í
&Icirc;&#206;Î
&Iuml;&#207;Ï
&ETH;&#208;Ð
&Ntilde;&#209;Ñ
&Ograve;&#210;Ò
&Oacute;&#211;Ó
&Ocirc;&#212;Ô
&Otilde;&#213;Õ
&Ouml;&#214;Ö
&times;&#215;×
&Oslash;&#216;Ø
&Ugrave;&#217;Ù
&Uacute;&#218;Ú
&Ucirc;&#219;Û
&Uuml;&#220;Ü
&Yacute;&#221;Ý
&THORN;&#222;Þ
&szlig;&#223;ß
&agrave;&#224;à
&aacute;&#225;á
&acirc;&#226;â
&atilde;&#227;ã
&auml;&#228;ä
&aring;&#229;å
&aelig;&#230;æ
&ccedil;&#231;ç
&egrave;&#232;è
&eacute;&#233;é
&ecirc;&#234;ê
&euml;&#235;ë
&igrave;&#236;ì
&iacute;&#237;í
&icirc;&#238;î
&iuml;&#239;ï
&eth;&#240;ð
&ntilde;&#241;ñ
&ograve;&#242;ò
&oacute;&#243;ó
&ocirc;&#244;ô
&otilde;&#245;õ
&ouml;&#246;ö
&divide;&#247;÷
&oslash;&#248;ø
&ugrave;&#249;ù
&uacute;&#250,ú
&ucirc;&#251;û
&uuml;&#252;ü
&yacute;&#253;ý
&thorn;&#254;þ
&yuml;&#255;ÿ


Autore: Fabrizio De Odorico

TAGS: ASP.NET, Caratteri speciali, Charset, Entità HTML, ISO 8859-1, Set di caratteri, Simboli

Postato il 24/03/2013 | Invia ad un amico  |   Versione stampabile  |   Aggiungi ai preferiti  |   Visite: 7573  |   Contattami su whatsapp

Modulo Login

 

 

 

 

 

Vuoi offrirmi un caffè?

Se trovi utili i miei articoli o vuoi aiutarmi ad aggiungere altro materiale sul sito...

fai una Donazione

Terminologia

La piattaforma .Net è una suite di prodotti creata dalla Microsoft dove i vari linguaggi di programmazione sono orientati agli oggetti (da C# a Visual Basic a J#).
Il bytecode di .NET viene compilato al momento dell'esecuzione (just in time compilation) ed è compatibile con le sole piattaforme Windows.

Java è un linguaggio di programmazione orientato agli oggetti creato dalla Sun Microsystems.
Il bytecode, generato dalla compilazione, viene interpretato dalla Java Virtual Machine in fase di esecuzione. Per questo motivo le applicazioni java sono indipendenti dall'hardware sulle quali vengono eseguite.