the tagger stanford pos ner natural language corenlp nlp stanford-nlp

tagger - stanford nlp github



Facilidad de uso: Stanford CoreNLP vs. OpenNLP (3)

Busco usar un conjunto de herramientas de PNL para un proyecto personal, y me preguntaba si el CoreNLP de Stanford es más fácil de usar o OpenNLP. ¿O hay otro paquete gratuito que recomendaría? Realmente no he hecho ninguna PNL antes, así que estoy buscando algo que pueda usar rápidamente para aprender los conceptos y prototipo de mis ideas. Cualquier ayuda es apreciada.


Le sugiero que Stanford, ya que proporciona varias cosas en un paquete que es de código abierto también, por ejemplo, Stanford CoreNLP tiene

  1. StanFord Parser.
  2. Stanford POS Tagger.
  3. Stanford Named Entity Recognition .
  4. Stanford Typed Dependencies. etc.

Entonces, en pocas palabras bajo un paraguas, obtienes múltiples soluciones ...


Te sugiero GATE (gate.ac.uk):

PORTÓN

  1. Idioma: Java
  2. Tiene soporte de integración UIMA
  3. Documentación: Super genial documentada! Tutoriales de cine y curso de formación.
  4. Tiene GUI
  5. Habilidad para usar WordNet, Lucene, Google, Yahoo, Google Translate, Weka
  6. Tiene algunas partes de LingPipe y OpenNLP como un complemento

OpenNLP

  1. Idioma: Java
  2. SharpNLP (su puerto C-Sharp)
  3. Tiene soporte de integración UIMA

LingPipe

  1. Idioma: Java
  2. Documentación: Tutoriales de libros gratuitos.

NLTK

  1. Idioma: Python
  2. Documentación: un excelente libro gratis.
  3. Corpora: proporciona una docena de datos de corpora (~ 850 MB) y léxicos como wordnet, etc.

Mi opinión sobre cuál es más fácil de usar es parcial, pero en relación con la respuesta de Ivan Akcheurov, solo lanzamos Stanford CoreNLP en octubre de 2010, por lo que no es muy antiguo. En cuanto a sus sugerencias, parece depender de si desea utilizar un marco de procesamiento de alto nivel o herramientas de procesamiento reales. Por ejemplo, si se topa con Knime, parece que los únicos componentes de NLP incluidos son en realidad los de OpenNLP , y la mayor parte del aprendizaje automático es Weka ... Para grupos de herramientas individuales que trabajan juntas, Stanford NLP, OpenNLP, NLTK, y Lingpipe son quizás las principales opciones.