usando - mysql_full_unicode_support#large_prefix

¿Qué compilación de MySQL es mejor para aceptar todos los caracteres Unicode? (1)

Nuestra columna está actualmente compaginada con latin1_swedish_ci y, obviamente, los caracteres especiales de Unicode se están eliminando. Queremos poder aceptar caracteres como U+272A ✪ , U+2764 ❤ , (consulte este artículo de wikipedia ), etc. Me utf8_unicode_ci por utf8_unicode_ci , ¿esta colación manejaría estos y otros caracteres? No me importa la velocidad ya que esta columna no es un índice.

Versión de MySQL: 5.5.28-1

La recopilación es la menor de tus preocupaciones, lo que debes tener en cuenta es el conjunto de caracteres para la columna / tabla / base de datos. La recopilación (reglas que rigen cómo se comparan y clasifican los datos ) es solo un corolario de eso.

MySQL es compatible con varios conjuntos de caracteres Unicode, siendo utf8 y utf8mb4 los más interesantes. utf8 admite caracteres Unicode en el BMP , es decir, un subconjunto de todo Unicode. utf8mb4 , disponible desde MySQL 5.5.3, es compatible con todos los Unicode.

La compilación que se utilizará con cualquiera de las codificaciones Unicode es probablemente xxx_general_ci o xxx_unicode_ci . El primero es un algoritmo de comparación y clasificación general independiente del lenguaje, el segundo es un algoritmo independiente del lenguaje más completo que admite más características de Unicode (por ejemplo, tratar "ß" y "ss" como equivalentes), pero por lo tanto también es más lento.

Consulte https://dev.mysql.com/doc/refman/5.5/en/charset-unicode-sets.html .