Juegos de caracteres son un conjunto de normas que contienen todas las teclas de entrada de teclado disponibles . El primer juego de caracteres ASCII populares funcionó bien para el idioma Inglés , pero como otras naciones comenzaron a utilizar las computadoras y las diversas necesidades , se requiere un nuevo conjunto de caracteres. UCS -2 y UTF - 8 son dos conjuntos de caracteres capaz de introducir datos desde casi cualquier teclado en el mundo.
UCS- 2 de codificación Unicode ( UCS- 2 )
UCS- 2 es un juego de caracteres que utiliza 16 bits por carácter , apoyando el Plano multilingüe Básico ( BMP ) . En comparación, ASCII utiliza sólo un byte . El rango de valores de código de bits entre 0 y 65535 y , en UCS- 2 , puede ser codificada en una palabra de 16 bits fija.
Tres bytes UTF - 8 Unicode Encoding
Con UTF - 8 , el mismo rango de conjunto de caracteres y bits de código se utiliza como UCS - 2 , pero que utiliza sólo de uno a tres bytes por carácter . Mientras que UCS- 2 puede ser codificado en un código de 16 bits fija , UTF - 8 codifica para cualquiera de 8, 16 o 24 bits . UTF -8 es un nuevo estándar de UCS- 2 .
Por defecto de MySQL a UCS- 2
MySQL es una aplicación de base de datos muy antiguo y su creación precedieron a la masa implementación de UTF - 8 . Por lo tanto , MySQL siempre ha favorecido UCS - 2 , que es adecuado para la mayoría de las implementaciones de bases de datos . Si desea utilizar UTF - 8 en lugar , puede hacerlo cambiando la configuración de base de datos .