getencoding - how to know the encoding of a file java
Auto-Detectar la codificación de caracteres en Java (1)
Se supone que el universalchardet de Mozilla es el detector eficiente que existe. juniversalchardet es el puerto java de la misma. Hay un puerto más. Lea este SO para obtener más información Algoritmo de detección de codificación de caracteres
Parece ser un problema bastante importante, pero aún no he podido encontrar una solución; Tal vez porque viene en muchos sabores. Aquí está sin embargo. Estoy tratando de leer algunos archivos delimitados por comas (de vez en cuando los delimitadores pueden ser un poco más únicos que las comas, pero las comas serán suficientes por ahora).
Se supone que los archivos están estandarizados en toda la industria, pero últimamente hemos visto muchos tipos diferentes de archivos de conjuntos de caracteres. Me gustaría poder configurar un BufferedReader para compensar esto.
¿Cuál es una forma bastante estándar de hacer esto y detectar si tuvo éxito o no?
Mis primeras reflexiones sobre este enfoque son recorrer los conjuntos de caracteres simples-> complejos hasta que pueda leer el archivo sin excepción. Aunque no es exactamente ideal ...
Gracias por tu atención.