nlp - stanford - ¿Hay algún Treebank gratis?
stanford parser spanish (3)
¿Hay algún lugar donde pueda descargar frases de Treebank of English gratis o por menos de $ 100? Necesito datos de capacitación que contengan un montón de oraciones sintácticas analizadas (> 1000) en inglés en cualquier formato. Básicamente, todo lo que necesito es que las palabras en estas oraciones sean reconocidas por una parte del discurso.
Aquí hay un par de bancos de árboles (en inglés) disponibles de forma gratuita:
American National Corpus: MASC
Preguntas: correcciones de QuestionBank y Stanford
Noticias británicas: BNC
TED habla: NAIST-NTT TED Treebank
Corpus multicapa de la Universidad de Georgetown: GUM
Biomédico:
Ver también Wikipedia para una lista enorme.
¿Qué hay de Penn Treebank? Espero que sea gratis o al menos asequible. http://www.cis.upenn.edu/~treebank/cdrom2.html
NLTK (para Python) ofrece varios bancos de árboles de forma gratuita .