net example celda tensorflow word2vec named-entity-recognition syntaxnet

example - TensorFlow RNN para el reconocimiento de entidades nombradas



rnn tensorflow (1)

Estoy tratando de determinar cuál es el mejor modelo para adaptar para un problema de reconocimiento de entidades con nombre abierto (biología / química, por lo que no existe un diccionario de entidades, pero deben identificarse por contexto).

Actualmente mi mejor opción es adaptar Syntaxnet para que en lugar de etiquetar palabras como N, V, ADJ, etc., aprenda a etiquetar como COMIENZO, DENTRO, FUERA (notación IOB).

Sin embargo, no estoy seguro de cuál de estos enfoques es el mejor?

  • Syntaxnet
  • word2vec
  • seq2seq (creo que este no es el correcto ya que lo necesito para aprender en dos secuencias alineadas, mientras que seq2seq está diseñado para secuencias de diferentes longitudes como en la traducción)

Estaría agradecido por un puntero al método correcto! ¡Gracias!


Syntaxnet se puede usar para el reconocimiento de entidades con nombre, por ejemplo, ver: Reconocimiento de entidades con nombre con Syntaxnet

word2vec solo no es muy efectivo para el reconocimiento de entidades nombradas. No creo que seq2seq se use comúnmente para esa tarea.

Como menciona drpng, es posible que desee consultar tensorflow / tree / master / tensorflow / contrib / crf . Agregar un LSTM antes de la capa de CRF ayudaría un poco, lo que da algo como :

Código LSTM + CRF en TensorFlow: https://github.com/Franck-Dernoncourt/NeuroNER