Con MySQL , ci sono due possibili set di caratteri disponibili per i dati da memorizzare in Questi set di caratteri Unicode riflettono la quantità di dati che viene memorizzato per ogni carattere nel database MySQL . L' UTF - 8 a tre byte Unicode codifica ( UTF - 8) set di caratteri è comunemente riconosciuto , ma non è il set di caratteri predefinito per MySQL . Che cosa sono i set di caratteri ?
I set di caratteri
sono insiemi di norme che contengono tutti i tasti di input da tastiera disponibili . Il primo set di caratteri ASCII popolare ha funzionato bene per la lingua inglese , ma, come le altre nazioni iniziarono ad usare i computer e le diversificate esigenze , sono stati richiesti nuovi set di caratteri . UCS -2 e UTF -8 sono entrambi i set di caratteri in grado di immettere dati da quasi qualsiasi tastiera al mondo .
UCS -2 codifica Unicode ( UCS -2 ) economici < p > UCS - 2 è un set di caratteri che utilizza 16 bit per carattere , sostenendo Basic Multilingual Plane ( BMP ) . In confronto , ASCII usato solo un byte . I valori di bit di codice compreso tra 0 e 65535 e , in UCS - 2 , può essere codificato in una parola fissa a 16 bit .
Tre byte UTF -8 Unicode codifica < br >
con la codifica UTF -8 , lo stesso set di caratteri e bit- codice di serie è usato come UCS -2 , ma utilizza solo tra 1-3 byte per carattere . Considerando che l' UCS -2 può essere codificato in una parola fissa a 16 bit , codifica UTF -8 per entrambi 8 , 16 o 24 bit . UTF - 8 è un nuovo standard di UCS - 2 .
Perché MySQL predefinito è UCS -2
MySQL è un vecchio applicazione di database e la sua creazione preceduto la massa realizzazione di UTF-8 . Pertanto , MySQL ha sempre favorito UCS - 2 , che è adatta per la maggior parte delle implementazioni di database . Se si desidera utilizzare la codifica UTF -8 , invece , è possibile farlo modificando le impostazioni del database .