tecnicas software programacion procesamiento para natural modelos lenguaje language ejemplos conceptos basicos nlp

nlp - programacion - procesamiento de lenguaje natural software



¿Existen gramáticas generativas publicadas para lenguajes naturales? (3)

Es posible que desee ver Attempto Controlled English y sus herramientas basadas en Prolog.

Dado que el análisis estadístico se puso de moda a principios de los 90, las gramáticas generalmente no se han distribuido, excepto en el caso de dominios de problemas específicos, sino derivados de corpus distribuidos como el Penn Treebank. Si puede conseguir eso (creo que se distribuye una muestra con NLTK), puede "hacer su propia gramática" mirando todos los fragmentos de árbol y traduciéndolos a reglas. (Por ejemplo, si encuentra un nodo etiquetado como S con niños etiquetados como NP y VP , usted sabe que debe existir una regla S -> NP VP . Sería una buena idea podar las reglas que ocurren con poca frecuencia).

Tengo algunas ideas para hacer con el procesamiento del lenguaje natural. Voy a necesitar algunas gramáticas de la

S -> NP VP

variedad para jugar con ellos.

Si intento escribir estas reglas yo mismo, será un negocio tedioso y propenso a errores. ¿Alguna vez ha escrito y publicado conjuntos completos de reglas para el inglés y otros lenguajes naturales? Idealmente escrito en BNF, Prolog o sintaxis similar.

Mi proyecto solo se relaciona con gramáticas libres de contexto, no me interesan los métodos estadísticos ni el aprendizaje automático: necesito producir sistemáticamente frases similares a las de Engligh y Foobarian.

Si sabes dónde encontrar ese material, te agradecería mucho.


La gramática más completa sin contexto para el inglés que conozco es la que se describe en:

Gazdar, Gerald; Ewan H. Klein, Geoffrey K. Pullum, Ivan A. Sag. 1985. Gramática de estructura de frase generalizada. Oxford: Blackwell.

También hay varias gramáticas basadas en reglas pero sin contexto disponibles gratuitamente en línea, por ejemplo, la gramática Penn XTAG o la gramática de recursos de inglés HPSG.


Mire en el Marco Gramatical . Es un lenguaje de programación funcional para aplicaciones de gramática multilingüe que viene con bibliotecas para ~ 30 idiomas, entre ellos inglés.