usando - mysql_full_unicode_support#large_prefix
¿Qué compilación de MySQL es mejor para aceptar todos los caracteres Unicode? (1)
Nuestra columna está actualmente compaginada con latin1_swedish_ci
y, obviamente, los caracteres especiales de Unicode se están eliminando. Queremos poder aceptar caracteres como U+272A ✪
, U+2764 ❤
, (consulte este artículo de wikipedia ), etc. Me utf8_unicode_ci
por utf8_unicode_ci
, ¿esta colación manejaría estos y otros caracteres? No me importa la velocidad ya que esta columna no es un índice.
Versión de MySQL: 5.5.28-1
La recopilación es la menor de tus preocupaciones, lo que debes tener en cuenta es el conjunto de caracteres para la columna / tabla / base de datos. La recopilación (reglas que rigen cómo se comparan y clasifican los datos ) es solo un corolario de eso.
MySQL es compatible con varios conjuntos de caracteres Unicode, siendo utf8
y utf8mb4
los más interesantes. utf8
admite caracteres Unicode en el BMP , es decir, un subconjunto de todo Unicode. utf8mb4
, disponible desde MySQL 5.5.3, es compatible con todos los Unicode.
La compilación que se utilizará con cualquiera de las codificaciones Unicode es probablemente xxx_general_ci
o xxx_unicode_ci
. El primero es un algoritmo de comparación y clasificación general independiente del lenguaje, el segundo es un algoritmo independiente del lenguaje más completo que admite más características de Unicode (por ejemplo, tratar "ß" y "ss" como equivalentes), pero por lo tanto también es más lento.
Consulte https://dev.mysql.com/doc/refman/5.5/en/charset-unicode-sets.html .