tagger - stanford nlp github
Facilidad de uso: Stanford CoreNLP vs. OpenNLP (3)
Busco usar un conjunto de herramientas de PNL para un proyecto personal, y me preguntaba si el CoreNLP de Stanford es más fácil de usar o OpenNLP. ¿O hay otro paquete gratuito que recomendaría? Realmente no he hecho ninguna PNL antes, así que estoy buscando algo que pueda usar rápidamente para aprender los conceptos y prototipo de mis ideas. Cualquier ayuda es apreciada.
Le sugiero que Stanford, ya que proporciona varias cosas en un paquete que es de código abierto también, por ejemplo, Stanford CoreNLP tiene
StanFord Parser.
-
Stanford POS Tagger.
-
Stanford Named Entity Recognition
. -
Stanford Typed Dependencies. etc.
Entonces, en pocas palabras bajo un paraguas, obtienes múltiples soluciones ...
Te sugiero GATE (gate.ac.uk):
PORTÓN
- Idioma: Java
- Tiene soporte de integración UIMA
- Documentación: Super genial documentada! Tutoriales de cine y curso de formación.
- Tiene GUI
- Habilidad para usar WordNet, Lucene, Google, Yahoo, Google Translate, Weka
- Tiene algunas partes de LingPipe y OpenNLP como un complemento
OpenNLP
- Idioma: Java
- SharpNLP (su puerto C-Sharp)
- Tiene soporte de integración UIMA
LingPipe
- Idioma: Java
- Documentación: Tutoriales de libros gratuitos.
NLTK
- Idioma: Python
- Documentación: un excelente libro gratis.
- Corpora: proporciona una docena de datos de corpora (~ 850 MB) y léxicos como wordnet, etc.
Mi opinión sobre cuál es más fácil de usar es parcial, pero en relación con la respuesta de Ivan Akcheurov, solo lanzamos Stanford CoreNLP en octubre de 2010, por lo que no es muy antiguo. En cuanto a sus sugerencias, parece depender de si desea utilizar un marco de procesamiento de alto nivel o herramientas de procesamiento reales. Por ejemplo, si se topa con Knime, parece que los únicos componentes de NLP incluidos son en realidad los de OpenNLP , y la mayor parte del aprendizaje automático es Weka ... Para grupos de herramientas individuales que trabajan juntas, Stanford NLP, OpenNLP, NLTK, y Lingpipe son quizás las principales opciones.