titulos snippets simbolos serps rich para metadescripciones iconos google emojis ctr unicode arabic

unicode - snippets - iconos para titulos google



En Unicode, ¿por qué hay dos representaciones para los dígitos árabes? (3)

¿Qué código prefieres para representar el número 4, U + 0664 o U + 06F4?

(٤ o ۴)?

Para ser coherente, deje que esta elección le indique qué códigos usa para 1, 2 y los otros códigos duplicados.

Estaba leyendo la especificación de Unicode @ Wikipedia ( Unicode árabe ) y veo que cada uno de los dígitos árabes tiene 2 puntos de código Unicode. Por ejemplo, 1 se define como U + 0661 y como U + 06F1.

¿Cuál debo usar?


De acuerdo con las tablas de códigos , U + 0660 .. U + 0669 son valores de DÍGITOS ÍNDICOS ÁRABICOS 0 a 9, mientras que U + 06F0 .. U + 06F9 son valores de DÍGITOS INDÍGENOS ARABIC EXTENDIDOS de 0 a 9.

En el libro Unicode 3.0 (5.2 es la versión actual, pero estas cosas no cambian mucho una vez configuradas), las series de glifos U + 066n están marcadas como "dígitos Árabes-Indicadores" y la serie de glifos U + 06Fn está marcada " Dígitos árabes-indios orientales (persa y urdu) ''. También observa:

  • U + 06F4 - ''glifos diferentes en persa y urdu''
  • U + 06F5 - ''Persa y urdu comparten un glifo diferente del árabe''
  • U + 06F6 - ''Glifo persa diferente del árabe''
  • U + 06F7 - ''Glifo urdu diferente del árabe''

Para comparacion:

  • U + 066n: ٠١٢٣٤٥٦٧٨٩
  • U + 06Fn: ۰۱۲۳۴۵۶۷۸۹

O, ampliado al convertir la información en un título:

U + 066n: ٠١٢٣٤٥٦٧٨٩

U + 06Fn: ۰۱۲۳۴۵۶۷۸۹

O:

U+066n U+06Fn 0 ٠ ۰ 1 ١ ۱ 2 ٢ ۲ 3 ٣ ۳ 4 ٤ ۴ 5 ٥ ۵ 6 ٦ ۶ 7 ٧ ۷ 8 ٨ ۸ 9 ٩ ۹

(Si puede ver alguno de ellos y la claridad con la que se diferencian puede depender de su navegador y de las fuentes instaladas en su máquina tanto como de cualquier otra cosa. Puedo ver claramente la diferencia en 4 y 6; 5 se ve muy similar en ambos.)

En base a esta información, si está trabajando con el árabe de Medio Oriente, use la serie de dígitos U + 066n; Si está trabajando con persa o urdu, use la serie de dígitos U + 06Fn. Como aplicación de Unicode, debe aceptar cualquiera de los conjuntos de códigos como dígitos válidos (pero puede mirar con recelo una secuencia que mezcla los dos conjuntos de dígitos, o simplemente puede dejarlo bien).


En general, no debe codificar dicha información en su aplicación.

  • En Windows puede usar GetLocaleInfo con LOCALE_SNATIVEDIGITS.
  • En Mac CFNumberFormatterCopyProperty con kCFNumberFormatterZeroSymbol.
  • O utilizar algo como ICU .

Hay países árabes que no usan los dígitos Árabe-Indicados de forma predeterminada. Por lo tanto, no hay un mapeo directo que diga árabe -> árabe - dígitos indic.

Y el usuario podría haber cambiado los valores predeterminados en el Panel de control de todos modos.