tesis sistemas sistema recomendacion java nlp spell-checking languagetool

java - sistemas - sistema de recomendacion tesis



Buscando la biblioteca del corrector ortográfico de Java (8)

Estoy buscando una biblioteca de ortografía Java de código abierto que tenga diccionarios para al menos los siguientes idiomas: francés, alemán, español y checo. ¿Cualquier sugerencia?



Debería comprobar que Jazzy usa en algunas aplicaciones Java de alto perfil. Dos problemas con eso:

  1. No ha sido actualizado desde 2005.
  2. Solo hay un diccionario de inglés en su página de SourceForge.

Hay algunos diccionarios de terceros flotando alrededor. Tuve uno para francés, la última vez que usé jazzy.


Echa un vistazo a JaSpell . Viene con un motor de revisión ortográfica interna o puede usar aspell . Dado que la fuente está disponible, también puede adjuntar motores similares a Hunspell fácilmente (como Hunspell ).

Viene con filtros para TeX y XML y tiene soporte para motores de sugerencias como la distancia del teclado, faltas de ortografía comunes (donde se pueden definir palabras y sus reemplazos por errores tipográficos comunes), distancia de Levenshtein y distancia fonética.



Otra alternativa posible es JOrtho http://jortho.sourceforge.net

Todavía no lo he usado, pero estoy evaluando los correctores ortográficos actuales de Java Open Source para descubrir cuál usar.


Otra buena biblioteca es JLanguageTool http://www.languagetool.org/usage/ Tiene una API bastante simple y hace correcciones y sugerencias ortográficas y gramaticales.

JLanguageTool langTool = new JLanguageTool(Language.AMERICAN_ENGLISH); langTool.activateDefaultPatternRules(); List<RuleMatch> matches = langTool.check("Hitchhiker''s Guide tot he Galaxy"); for (RuleMatch match : matches) { System.out.println("Potential error at line " + match.getEndLine() + ", column " + match.getColumn() + ": " + match.getMessage()); System.out.println("Suggested correction: " + match.getSuggestedReplacements()); }

También puede usarlo para alojar su propio servicio web de ortografía y gramática.


Puedes probar Suggester . Es de código abierto, gratuito y es compatible con todos los idiomas mencionados anteriormente.


Hunspell parece que podría ser de utilidad. Está escrito en C ++ pero tiene una interfaz java según la página de inicio. Tri-licenciado bajo GPL, LGPL y MPL por lo que no debería tener un problema con él.