Transformation Format Unicode (UTF - 8) è un formato di codifica dei caratteri che utilizza blocchi di otto bit per rappresentare un personaggio , ed è ampiamente utilizzato in sistemi informatici. Esso comprende la stessa codifica compatta testo normale come formato ASCII , ma anche permette la codifica di caratteri speciali . Questo dà ulteriori funzionalità, ma pone delle sfide quando usato in codice di programma . Le versioni successive di nave Perl con moduli di codifica e una funzione binmode che permettono al linguaggio di programmazione per gestire la codifica e la decodifica di file UTF-8 . Ingresso e uscita a /da un programma Perl possono essere fatte per gestire UTF-8 caratteri attraverso l'utilizzo di un interruttore sulla linea di comando . Cose che ti serviranno
ActiveState Perl
Perl Editor
Mostra più istruzioni
1
lanciare l'editor Perl per avviare la codifica del programma Perl . È possibile utilizzare un semplice editor di testo , come Blocco note su Windows o l'editor vi su UNIX . Dovrete salvare il file con estensione . Pl in modo che il sistema sarà in grado di riconoscerlo come un programma Perl .
2
Inserire un imperativo per richiedere il modulo " Encode " in alto del programma Perl . Sarete in grado di utilizzare le funzioni di codifica e decodifica nel corpo del programma Perl per codificare /decodificare i dati in /out del formato UTF-8 , come richiesto . Digitare il seguente nell'editor Perl per usare questo metodo :
# /usr /bin /PerlRequire Encode , in alternativa , è possibile chiamare il modulo Encode , come segue : utilizzare Encode , per codificare i dati , è necessario digitare il seguente nel corpo del vostro programma : $ output = encode :: encode ( " utf8 " , $ stringa ) ;
3
Specificare il formato di codifica UTF -8 quando si apre un file. È possibile farlo digitando uno dei seguenti formati in all'editor:
file aperto, " < : encoding ( iso-8859- 7) " , $ file-input ;
aperto fILE , " < : utf8 " . , $ inputfile ;
Questo dirà Perl per codificare il file nel formato UTF -8 , o di prepararsi per la codifica UTF -8
4
Specificare il " binmode " durante la lettura o la scrittura di file , per garantire che i file vengono codificati in formato UTF -8 .
per impostare il binmode a UTF-8 durante la lettura di un file , digitare il seguente nell'editor : $ filename = " filename.txt " ; $ file-input = IO :: File - > new ( $ filename , 'r '); binmode ( $ file-input , ' : utf8 ');
< p > per impostare il binmode a UTF-8 durante la scrittura di un file, digitare quanto segue nell'editor : $ filename = " filename.txt " ; open ( OUT , "> $ nomefile" ) ; binmode (OUT , " , : utf8 " ) ;
È inoltre possibile utilizzare binmode per impostare il formato di input e output standard UTF -8 , come segue : binmode ( STDIN , ' : utf8 '); binmode ( STDOUT , ' : utf8 ');