datasets database dataset nlp text-mining emotion

database - datasets - Conjuntos de datos para la detección de emociones en el texto



nlp datasets (1)

El campo de la detección de emociones textuales es todavía muy nuevo y la literatura está fragmentada en muchas revistas diferentes de diferentes campos. Es realmente difícil ver qué hay allí afuera.

Tenga en cuenta que hay varias teorías de la emoción de la psicología. De ahí que haya diferentes formas de modelar / representar emociones en la informática. La mayoría de las veces "emoción" se refiere a un fenómeno como la ira, el miedo o la alegría. Otras teorías afirman que todas las emociones se pueden representar en un espacio multidimensional (por lo que hay un número infinito de ellas).

Aquí hay algunos conjuntos de datos (disponibles públicamente) que conozco (actualizados):

  1. EmoBank. 10k frases anotadas con los valores de Valence, Arousal and Dominance (revelación: soy uno de los autores). https://github.com/JULIELab/EmoBank

  2. El conjunto de datos "Intensidad de la emoción en los tweets" de la tarea compartida de WASSA 2017. http://saifmohammad.com/WebPages/EmotionIntensity-SharedTask.html

  3. Las publicaciones de Valence and Arousal en Facebook de Preotiuc-Pietro y otros: http://wwbp.org/downloads/public_data/dataset-fb-valence-arousal-anon.csv

  4. Los datos de Afecto de Cecilia Ovesdotter Alm: http://people.rc.rit.edu/~coagla/affectdata/index.html

  5. Los datos de Emotion in Text establecidos por CrowdFlower https://www.crowdflower.com/wp-content/uploads/2016/07/text_emotion.csv

  6. ISEAR: http://emotion-research.net/toolbox/toolboxdatabase.2006-10-13.2581092615

  7. Test Corpus of SemEval 2007 (Tarea sobre texto afectivo) http://web.eecs.umich.edu/~mihalcea/downloads.html

  8. Una reannotación de los datos de la postura de SemEval con las emociones: http://www.ims.uni-stuttgart.de/data/ssec

Si desea profundizar en el tema, aquí hay algunas encuestas que recomiendo (revelación: Fui el autor del primero).

  1. Buechel, S., y Hahn, U. (2016). Análisis de emociones como un problema de regresión - Modelos dimensionales y sus implicaciones en la representación emocional y la evaluación métrica. En ECAI 2016.22ª Conferencia Europea sobre Inteligencia Artificial (pp. 1114-1122). La Haya, Países Bajos (disponible: http://ebooks.iospress.nl/volumearticle/44864 ).

  2. Canales, L., y Martínez-Barco, P. (nd). Detección de emociones desde el texto: una encuesta. Procesamiento en los 5tos días hábiles de investigación de sistemas de información (JISIC 2014), 37 (disponible en: http://www.aclweb.org/anthology/W14-6905 ).

Estoy implementando un sistema que podría detectar la emoción humana en el texto. ¿Hay conjuntos de datos anotados manualmente disponibles para el aprendizaje supervisado y las pruebas?