tabla letras iconos consorcio codigo unicode character-encoding unicode-string

letras - ¿Cuál es el rango de caracteres imprimibles Unicode?



unicode letras (4)

¿Alguien puede decirme cuál es el rango de caracteres imprimibles Unicode? [Por ejemplo, el rango de caracteres imprimibles de Ascii es / u0020 - / u007f]


Lo que debe hacer es elegir una fuente y luego generar una lista de los caracteres Unicode que tienen glifos definidos para su fuente. Puede usar una biblioteca de fuentes como freetype para probar glifos (pruebe FT_Get_Char_Index (...)! = 0).


Primero, debe eliminar la palabra "UTF8" en su pregunta, no es pertinente (UTF8 es solo una de las codificaciones de Unicode, es algo ortogonal a su pregunta).

Segundo: el significado de "imprimible / no imprimible" es menos claro en Unicode. Quizás te refieres a un " personaje gráfico "; y uno incluso puede disputar si un espacio es imprimible / gráfico. Los caracteres no gráficos consistirían, básicamente, en caracteres de control: el rango 0x00-0x0f más algunos otros que están dispersos.

De todos modos, la gran mayoría de los caracteres Unicode (más de 200,000) son "gráficos". Pero esto ciertamente no implica que sean imprimibles en su entorno.

Me parece una mala idea, si tiene la intención de generar una cadena Unicode "imprimible aleatoriamente", para tratar de incluir todos los caracteres "imprimibles".


Ver, http://en.wikipedia.org/wiki/Unicode_control_characters

Es posible que desee ver especialmente el carácter de control C0 y C1 http://en.wikipedia.org/wiki/C0_and_C1_control_codes

El wiki dice que el carácter de control C0 está en el rango U + 0000-U + 001F y U + 007F (que es el mismo rango que ASCII) y el carácter de control C1 está en el rango U + 0080-U + 009F

aparte del carácter de control C, Unicode también tiene cientos de caracteres de control de formateo, por ejemplo, no anotador de ancho cero, que acerca el espaciado entre caracteres, o control de texto bidireccional. Estos caracteres de control de formato están bastante dispersos.

Más importante aún, ¿qué estás haciendo que requiere que conozcas los caracteres no imprimibles de Unicode? Lo más probable es que lo que sea que intentes hacer sea el enfoque equivocado para resolver tu problema.


Unicode , stict term, no tiene rango. Los números pueden ir infinito.

Lo que has dado no es UTF8, que tiene 1 byte para los caracteres ASCII.

En cuanto al rango, creo que no hay un rango de caracteres imprimibles. Siempre evoluciona Mira la página que di más arriba.