nlp - software - stanford online parser
Encontrar el tiempo de una oraciĆ³n usando stanford nlp (3)
Básicamente, el tiempo de una oración en inglés está determinado por la forma del verbo que es la cabeza de la oración. Puede leer más sobre este tema en este post sobre el conjugador del tiempo de Contextors . La identificación del verbo principal y su forma es posible usando un analizador sintáctico.
El tipo de información que se puede extraer de una oración depende del análisis que realice. Puede extraer otros componentes de la oración tales como los complementos preposicionales, los complementos predicativos y los adjuntos, así como otros atributos gramaticales como el aspecto, el tiempo secundario, la modalidad y la polaridad. Algunas oraciones contienen cláusulas incrustadas, como en el siguiente ejemplo de la API de Contextors . En este caso, es posible que desee extraer esta información también de la cláusula incrustada.
Q1.Estoy tratando de obtener el tiempo de una oración completa, simplemente no sé cómo hacerlo usando nlp. Cualquier ayuda apreciada.
Q2. ¿Qué información puede extraerse de una oración usando nlp?
Actualmente puedo, obtengo: 1.Voice of sentence 2.subject object verb 3.POS tags.
Se puede extraer más información, por favor avíseme.
El banco de árboles Penn define VBD
y VBN
como el tiempo pasado y el participio pasado de un verbo, respectivamente. En muchas oraciones, bastará con obtener las etiquetas POS y verificar la presencia de estas dos etiquetas. En otros, sin embargo, puede haber verbos en tiempos múltiples mientras que la oración como un todo está en tiempo pasado. Para estos casos, debe usar el análisis de constituyentes. Stanford NLP también proporciona un analizador sintáctico. Puede usar esto para detectar la frase verbal más externa (etiquetada como VP
). Si una forma de tiempo pasado / participio de un verbo es un antepasado de todos los demás verbos en la frase verbal, el tiempo de la oración debe marcarse como tiempo pasado.
El ejemplo dado por Dror produce esto:
(ROOT
(S
(NP (PRP I))
(VP (VBD did) (RB n''t)
(VP (VB want)
(NP (DT the) (NN dog)
(S
(VP (TO to)
(VP (VB eat)
(NP (PRP$ my) (NN homework))))))))
(. .)))
Aunque comer no es tiempo pasado, el verbo más elevado en la frase verbal está etiquetado correctamente VBD
(es decir, tiempo pasado ).
editar (información adicional):
Las oraciones complejas tienen lo que se llama el tiempo primario y el tiempo secundario . Para oraciones como "Para cuando llegue allí, ya se habría ido", no existe el "tiempo completo". Solo puedes distinguir entre el primario y el secundario.
Si desea información sobre perfecto , continuo , etc., tendrá que derivar reglas basadas en las etiquetas de POS. Por ejemplo, un verbo auxiliar en tiempo presente seguido de un verbo en tiempo pasado expresará el presente perfecto (si hay contraejemplos obvios, por favor agregue a la respuesta ... No puedo pensar en ninguno en este momento).
Quiero tiempo completo, por ejemplo: presente simple O presente tiempo continuo perfecto ... por lo que sé, no puedo obtener simplemente de las etiquetas POS
Tenga en cuenta que lo que tiene en sus ejemplos anteriores no son ejemplos de tiempo verbal, sino más bien ejemplos de ciertas configuraciones de tiempo / aspecto. Mientras que el tiempo en sí mismo (pasado, presente, futuro) coloca una eventualidad en el tiempo, las categorías de aspecto (progresivo, continuo, perfectivo y similares) más bien relacionan la eventualidad con el flujo de tiempo (es decir, si está limitado / completado, si fue un evento continuo, etc.). Por lo tanto, el tiempo y el aspecto son dos categorías gramaticales distintas. En inglés, ambos forman parte del complejo verbal, lo que hace que sea más fácil confundirlos y buscarlos / analizarlos en un solo método. En muchos otros idiomas, se realizan por separado (distintas posiciones estructurales, elementos funcionales, construcciones, etc.). Tener cuidado.