python - graphs - Conversión de adjetivos y adverbios a sus formas nominales
nltk tokenize (1)
Busque en google o SO términos como ''stemming'' y ''lemmatization'', estos términos pueden ayudarlo a obtener lo que está buscando.
Por ejemplo, vaya a http://qaa.ath.cx/porter_js_demo.html e ingrese las palabras ''hermosa'' y ''belleza'', y verá que ambas tienen el mismo token.
Porter stemmer básicamente elimina los sufijos comunes que se encuentran en el idioma inglés, por lo que no es definitivo, pero es un buen lugar para comenzar.
Puede considerar que las palabras que se asignan al mismo origen también son en cierto sentido sinónimos. Si también puedes obtener parte de las etiquetas del discurso para todas estas palabras, podrás inferir que la belleza es la forma nominal del adjetivo hermoso.
Estoy experimentando con la desambiguación de los sentidos de las palabras usando wordnet para mi proyecto. Como parte del proyecto, me gustaría convertir un adjetivo derivado o una forma de adverbio en su forma raíz.
Por ejemplo
hermosa ==> belleza maravillosa ==> maravilla
¿Cómo puedo conseguir esto? ¿Hay algún otro dict aparte de wordnet que proporcione este tipo de transformación?
Sería una ventaja adicional para mí si pudiera mapear el sentido exacto de la palabra adjetivo a su forma nominal con sentido exacto. ¿Es eso posible?
Gracias