lista - Light C Biblioteca Unicode
utf-8 html (3)
Estoy buscando una pequeña biblioteca de C para manejar cadenas utf8.
Específicamente, división basada en delimitadores Unicode para usar con algoritmos de derivación.
Publicaciones relacionadas han sugerido:
ICU http://www.icu-project.org/ (Lo encontré demasiado voluminoso para mis propósitos en dispositivos integrados)
UTF8-CPP: http://utfcpp.sourceforge.net/ (Excelente, pero C ++ no C)
¿Alguien ha encontrado bibliotecas de bases de código pequeñas, independientes de la plataforma para manejar cadenas de caracteres unicode (no necesita naturalización).
También hay MicroUTF-8 .
UTF-8 está especialmente diseñado para que muchas funciones de cadenas orientadas a bytes continúen funcionando o solo necesiten modificaciones menores.
La función strstr
de C, por ejemplo, funcionará perfectamente siempre que sus dos entradas sean cadenas UTF-8 válidas y terminadas en nulo. strcpy
funciona bien siempre que su cadena de entrada comience en un límite de caracteres (por ejemplo, el valor de retorno de strstr
).
¡Entonces quizás ni siquiera necesites una biblioteca separada!
Una biblioteca agradable y liviana que utilizo con éxito es utf8proc .