spanish - Stanford CoreNLP resolución de correferencia errónea

stanford nlp spanish (1)

Todavía estoy jugando con CoreNLP de Stanford y estoy encontrando resultados extraños en una prueba muy trivial de resolución Coreference.

Dadas las dos oraciones:

El hotel tenía un baño grande. Estaba muy limpio

Esperaría que "It" en la oración 2 fuera correlacionado por "baño" o al menos "un baño grande" de la oración 1.

Lamentablemente, señala "El hotel", que en mi opinión es incorrecto.

Hay alguna manera de resolver este problema ? ¿Tengo que entrenar algo o se supone que debe funcionar de la caja?

Annotation a = getPipeline().getAnnotation("The hotel had a big bathroom. It was very clean."); System.out.println(a.get(CorefChainAnnotation.class));

salida:

{1 = CADENA1 - ["El hotel" en la oración 1, "Ello" en la oración 2], 2 = CADENA2 - ["un baño grande" en la oración 1]}

Muchas gracias por su ayuda.

Al igual que muchos componentes en IA, el sistema de correferencia de Stanford solo es correcto con cierta precisión. En el caso de la correferencia, esta precisión es en realidad relativamente baja (~ 60 en los puntos de referencia estándar en un rango de 0-100). Para ilustrar la dificultad del problema, considere la siguiente frase aparentemente similar con un juicio de correferencia diferente:

El hotel tenía una gran bañera. Fue muy caro