tecnicas software procesamiento natural lenguaje informatica extracción conceptos basicos articulos aplicaciones algorithm machine-learning nlp artificial-intelligence

algorithm - software - procesamiento del lenguaje



Tutoriales para procesamiento de lenguaje natural (6)

Además del libro de Jurafsky y Martin, los Fundamentos del procesamiento del lenguaje natural estadístico de Christopher D. Manning y Hinrich Schütze también son ampliamente utilizados. Para IR, Manning et al. también escribió Introducción a la Recuperación de Información que se puede leer o descargar en línea en su sitio.

Hace poco asistí a una clase en coursera sobre "Procesamiento del lenguaje natural" y aprendí mucho sobre el análisis sintáctico, IR y otros aspectos interesantes como preguntas y respuestas, etc., aunque entendí bien los conceptos, pero en realidad no tuve ningún conocimiento práctico de ello. ¿Alguien puede sugerirme buenos tutoriales en línea o libros para procesamiento de lenguaje natural?

Gracias


En lugar de leer un libro específico, sumergirse en el mar de papeles podría ser una buena idea. http://www.aclweb.org , por ejemplo, contiene muchos temas sobre PNL. A través de esos documentos, obtienes referencias a más artículos, algunos de los cuales son los cimientos de una cierta rama de PNL. Y debido a que fueron escritos por diferentes autores, es poco probable que te influya demasiado un punto de vista.


Hay un centro para materiales de enseñanza y aprendizaje llamado TeLeMaCo . Puede encontrar recursos para muchos aspectos de PNL y puede agregar fácilmente más materiales que haya encontrado en la web.


Puede leer Jurafsky and Martin''s Speech and Language Processing (edición de 2008) , que es el libro de texto estándar en el campo. Es largo y tiene una variedad de temas, por lo que sugiero que lea solo los capítulos que realmente se aplican a sus intereses.

Además, la mejor manera de aprender es casi seguro que realmente implemente algoritmos NLP desde cero. Puede elegir algunas tareas estándar (modelado de lenguaje, clasificación de texto, etiquetado POS, NER, análisis) e implementar varios algoritmos desde cero (modelos de ngram, HMM, Naive Bayes, MaxEnt, CKY) para comprender realmente qué los hace funcionar. Tampoco debería ser demasiado difícil encontrar algún conjunto de datos gratuito para probar sus implementaciones.

Finalmente, hay muchos tutoriales para algoritmos NLP específicos que son excelentes. Por ejemplo, si desea construir un HMM, sugiero el tutorial de Jason Eisner, que también cubre el alisamiento y la capacitación sin supervisión con EM. Si desea implementar el muestreo de Gibbs para el entrenamiento sin supervisión de Naive Bayes, sugiero el tutorial de Philip Resnik .


Si desea conocimiento práctico sobre cómo puede trabajar en el lenguaje natural, debe comenzar a implementarlo. Sugiero usar NLTK (Natural Language Proecessing Toolkit) con Python. Es fácil de implementar NLP en python.

Puede consultar este enlace http://nltk.org/

O puede probarlo en línea en http://cst.dk/online/pos_tagger/uk/


Si usted es un desarrollador de Java, hay una lista extensa de tutoriales sobre cómo construir componentes de sistemas NLP utilizando LingPipe en http://alias-i.com/lingpipe/demos/tutorial/read-me.html . Divulgación completa Escribí algunos de esos tutoriales y uno de los libros a continuación.

Hay algunos libros que están más orientados a la industria:

1) Procesamiento de lenguaje natural con Java de Richard M Reese

Esto cubre cómo hacer algunas tareas comunes con una variedad de kits de herramientas de código abierto (incluido LingPipe).

2) Procesamiento del lenguaje natural con Java y LingPipe Cookbook Paperback por Breck Baldwin, Krishna Dayanidhi

Este libro está orientado a tareas al nivel de "obtener el componente creado" y cubre las principales tecnologías que impulsan la mayoría de los sistemas NLP que son impulsados ​​por texto. No cubre la traducción. Entra en más detalles que el primer libro y tiene una cobertura más amplia que los tutoriales de LingPipe, pero a veces es menos detallado que los tutoriales.

Breck