spanish opennlp

spanish - opennlp python



Opennlp Chunker y postag resultados (3)

Java - opennlp

Soy nuevo en opennlp y trato de analizar la oración y obtener el resultado de la etiqueta y el fragmento, pero no pude entender el significado de los valores. ¿Hay alguna tabla que pueda explicar el significado completo de la forma de la etiqueta de la publicación y del resultado de la porción?

Tokens: [My, name, is, Chris, corrale, and, I, live, in, Philadelphia, USA, .] Post Tags: [PRP$, NN, VBZ, NNP, NN, CC, PRP, VBP, IN, NNP, NNP, .] chunk Result: [B-NP, I-NP, B-VP, B-NP, I-NP, O, B-NP, B-VP, B-PP, B-NP, I-NP, O]


Consulte la lista POSTag para obtener los detalles de las etiquetas.

Las etiquetas de fragmentos como " B-NP " se componen de dos o tres partes:
Primera parte

B - marks the beginning of a chunk I - marks the continuation of a chunk E - marks the end of a chunk

Como parte, puede ser de una sola palabra (como "Ella" en el ejemplo anterior), puede ser tanto el principio como el final de una parte al mismo tiempo.

Segunda parte :

NP - noun chunk VP - verb chunk

Para más referencia puede consultar la documentación de OpenNLP .


Las etiquetas POS son del conjunto de etiquetas Penn Treebank . Los fragmentos son frases nominales (NP), frases verbales (VP) y preposiciones (PP). "B- .." marca el comienzo de dicha frase, "I- .." significa algo como "interior", es decir, la frase continúa aquí (consulte la documentación de OpenNLP ).


S -> Cláusula declarativa simple, es decir, una que no es introducida por una conjunción subordinada (posiblemente vacía) o una palabra wh y que no presenta inversión sujeto-verbo.

SBAR -> Cláusula introducida por una conjunción subordinada (posiblemente vacía).

SBARQ -> Pregunta directa introducida por una palabra wh o una frase wh. Las preguntas indirectas y las cláusulas relativas deben estar entre corchetes como SBAR, no SBARQ.

SINV -> Sentencia declarativa invertida, es decir, una en la que el sujeto sigue el verbo tenso o modal.

SQ -> Pregunta sí / no invertida, o cláusula principal de una pregunta wh, después de la frase wh en SBARQ.

ADJP -> Frase Adjetiva.

ADVP -> Frase Adverbio.

CONJP -> Conjunción Frase.

FRAG -> Fragmento.

INTJ -> Interjección. Corresponde aproximadamente a la etiqueta de parte de discurso UH.

LST -> Marcador de lista. Incluye puntuacion circundante.

NAC -> No es un constituyente; utilizado para mostrar el alcance de ciertos modificadores prenominales dentro de un NP.

NP -> Sustantivo Frase.

NX -> Se usa dentro de ciertos NP complejos para marcar la cabeza del NP. Corresponde muy aproximadamente a N-bar

PP -> Frase preposicional.

PRN -> Parenthetical.

PRT -> Partícula. Categoría para palabras que deben ser etiquetadas RP.

QP -> Frase cuantificadora (es decir, medida compleja / frase de cantidad); utilizado dentro de NP.

RRC -> Cláusula relativa reducida.

UCP -> A diferencia de la frase coordinada.

VP -> Frase verbal.

WHADJP -> Wh-adjective Phrase. Frase de adjetivo que contiene un wh-adverbio, como en cómo caliente.

WHAVP -> Frase de adverbio wh. Introduce una cláusula con una brecha de NP. Puede ser nulo (que contiene el complementador 0) o léxico, que contiene un wh-adverbio tal como cómo o por qué.

WHNP -> Wh-noun Phrase. Introduce una cláusula con una brecha de NP. Puede ser nulo (que contiene el complementador 0) o léxico, que contiene alguna palabra, por ejemplo, quién, qué libro, cuya hija, ninguno de ellos o cuántos leopardos.

WHPP -> Frase preposicional de WH. Frase preposicional que contiene una frase wh-noun (como por ejemplo, o por cuya autoridad) que introduce una brecha PP o está contenida en un WHNP.

X -> Desconocido, incierto, o ininteligible. X se usa a menudo para encuadernar errores tipográficos y para encuadernar las ... las-construcciones.

Crédito: http://mail-archives.apache.org/mod_mbox/opennlp-users/201402.mbox/%3CCACQuOSXOeyw2O-AZtW3m=iABo1=3cpZOdPiWFXoNwN-SVWo4gQ@mail.gmail.com%3E