python - spanish - para que sirve nltk
¿Hay alguna manera de decirle a NLTK que cierta palabra no es un nombre propio sino un sustantivo? (1)
En resumen, tiene las siguientes opciones:
- Corregir la etiqueta en el postprocesamiento: un poco feo pero rápido y fácil.
- Emplee un identificador de entidad de nombre externo (Stanford NER como @Bob Dylan ha sugerido cuidadosamente) - este es más complicado, particularmente porque Stanford NER está en Java y no es particularmente rápido.
- Recrear un Tagger de POS en datos específicos del dominio (¿tiene un conjunto de datos anotado lo suficientemente grande como para usarlo para eso?)
- Utilice el enfoque WSD (desambiguación de sentido de palabra): para comenzar, necesita tener un buen diccionario de dominio para usar.
Estoy haciendo un poco de PNL cuando descubro cuándo los pacientes fueron diagnosticados con esclerosis múltiple.
Me gustaría usar nltk para decirme que el sustantivo de una oración era esclerosis múltiple. El problema es que los médicos con frecuencia se refieren a la esclerosis múltiple como MS, que nltk toma como un nombre propio.
Por ejemplo, esta oración, "Su EM fue diagnosticada en 1999". Está etiquetado como: [(''His'', ''PRP$''), (''MS'', ''NNP''), (''was'', ''VBD''), (''diagnosed'', ''VBN''), (''in'', ''IN''), (''1999'', ''CD''), (''.'', ''.'')]
MS debería ser un sustantivo aquí. ¿Alguna sugerencia?