Computer non capiscono testo e simboli in modo nativo . Invece, usano un linguaggio di codifica conosciuto come Unicode di tradurre i numeri e le lettere al loro testo e simboli del caso, noto come un set di caratteri . I tipi più comuni di Unicode sono UTF -8 , UTF - 16 , ISO - 8859-1 e ASCII . Vi è un identificatore univoco per ogni lettera testuale e simbolo in Unicode , che rimane costante su diversi sistemi operativi e linguaggi di programmazione . La maggior parte dei linguaggi di programmazione sono dotati di funzioni per convertire tra diversi standard Unicode . Istruzioni
1
Tradurre il charset in PHP . Tipo " utf8_decode ( $ data ) ", dove " $ data " indica il codice UTF-8 . La risultante charset ISO - 8859-1 viene emesso .
2
Tradurre il charset in PERL . Tipo " utilizzare Encode qw ( from_utf8 to_iso88591 ) ;
from_to ( $ data , " utf8 " , " iso - 8859-1 ") . " Sostituire " da -utf8 " con il set di caratteri UTF-8 encoded e " to_iso88591 " con l'uscita di ISO - 8859-1 desiderata .
3
Tradurre il charset in Python . Digitare il seguente codice .
Source_encoding = "utf - 8" stringa
= utf8variable stringa
= string.encode ( source_encoding ) per stringa
= unicode ( stringa , ' iso-8859 -1' ) per
Sostituire " utf8variable " con la variabile che tiene il set di caratteri UTF-8 .