utf8_general_ci utf8 ejemplos convert collations sql-server unicode internationalization

sql server - utf8 - ¿Existe tal cosa como ''colación Unicode''?



sql server unicode collation (3)

Bueno, siempre hay una intercalación binaria como Latin1_General_BIN2. Almacena los puntos de código en orden numérico, lo que puede ser bastante arbitrario. Sin embargo, no es específico de la cultura (a pesar del nombre).

Parece que no hay una forma inteligente de ordenar los datos de varios idiomas / culturas juntos, por lo que en lugar de una solución a medias, todo lo que puede hacer es ordenar los valores binarios.

O si no lo hace, entonces, ¿qué es realmente una collation Sql Server? Tal vez mi comprensión de la colación (como un concepto) es incorrecta.

No deseo especificar mi compaginación con el griego, el islandés o incluso el europeo occidental. Deseo poder utilizar cualquier idioma que sea compatible con Unicode.

(Estoy usando MSSQL 2005)

ACTUALIZACIÓN: Bueno, estoy reformulando la pregunta: ¿Existe una clasificación genérica e independiente de la cultura que se pueda utilizar para los textos de cualquier cultura? Sé que no contendrá reglas específicas de cultura como ''ty'' en húngaro o ß = ss en alemán, pero proporcionará resultados consistentes, en su mayoría aceptables.

¿Hay alguna colación que no sea ​​específica de la cultura?


Este es un buen artículo para saber qué es intercalación, breve y dulce: SQL Server y Intercalación .

La recopilación es algo que le permitirá comparar y ordenar los datos. Por lo que puedo recordar, no hay nada como la recopilación de Unicode.


Existe una intercalación predeterminada de Unicode, la "Tabla de elementos de intercalación predeterminada de Unicode (DUCET)", que se describe en el documento del Estándar técnico sobre algoritmo de intercalación de Unicode http://www.unicode.org/reports/tr10/ .

Pero uno lo llama la recopilación por defecto de Unicode en lugar de la recopilación de Unicode porque, por supuesto, hay más de uno, por ejemplo, el gráfico de unicode.org para húngaro http://www.unicode.org/cldr/charts/28/collation/hu.html describe cómo la intercalación húngara para los caracteres de Unicode se diferencia del DUCET.

Desde que se hizo esta pregunta, las intercalaciones de SQL Server se han hecho más conscientes de Unicode https://docs.microsoft.com/en-us/sql/relational-databases/collations/collation-and-unicode-support?view=sql-server-2017 . Mientras tanto, algunos DBMS de código abierto han adquirido la capacidad de admitir DUCET y otras intercalaciones de Unicode, al incorporar la biblioteca de ICU (International Components for Unicode).