database - datasets - Conjuntos de datos para la detección de emociones en el texto
nlp datasets (1)
El campo de la detección de emociones textuales es todavía muy nuevo y la literatura está fragmentada en muchas revistas diferentes de diferentes campos. Es realmente difícil ver qué hay allí afuera.
Tenga en cuenta que hay varias teorías de la emoción de la psicología. De ahí que haya diferentes formas de modelar / representar emociones en la informática. La mayoría de las veces "emoción" se refiere a un fenómeno como la ira, el miedo o la alegría. Otras teorías afirman que todas las emociones se pueden representar en un espacio multidimensional (por lo que hay un número infinito de ellas).
Aquí hay algunos conjuntos de datos (disponibles públicamente) que conozco (actualizados):
EmoBank. 10k frases anotadas con los valores de Valence, Arousal and Dominance (revelación: soy uno de los autores). https://github.com/JULIELab/EmoBank
El conjunto de datos "Intensidad de la emoción en los tweets" de la tarea compartida de WASSA 2017. http://saifmohammad.com/WebPages/EmotionIntensity-SharedTask.html
Las publicaciones de Valence and Arousal en Facebook de Preotiuc-Pietro y otros: http://wwbp.org/downloads/public_data/dataset-fb-valence-arousal-anon.csv
Los datos de Afecto de Cecilia Ovesdotter Alm: http://people.rc.rit.edu/~coagla/affectdata/index.html
Los datos de Emotion in Text establecidos por CrowdFlower https://www.crowdflower.com/wp-content/uploads/2016/07/text_emotion.csv
ISEAR: http://emotion-research.net/toolbox/toolboxdatabase.2006-10-13.2581092615
Test Corpus of SemEval 2007 (Tarea sobre texto afectivo) http://web.eecs.umich.edu/~mihalcea/downloads.html
Una reannotación de los datos de la postura de SemEval con las emociones: http://www.ims.uni-stuttgart.de/data/ssec
Si desea profundizar en el tema, aquí hay algunas encuestas que recomiendo (revelación: Fui el autor del primero).
Buechel, S., y Hahn, U. (2016). Análisis de emociones como un problema de regresión - Modelos dimensionales y sus implicaciones en la representación emocional y la evaluación métrica. En ECAI 2016.22ª Conferencia Europea sobre Inteligencia Artificial (pp. 1114-1122). La Haya, Países Bajos (disponible: http://ebooks.iospress.nl/volumearticle/44864 ).
Canales, L., y Martínez-Barco, P. (nd). Detección de emociones desde el texto: una encuesta. Procesamiento en los 5tos días hábiles de investigación de sistemas de información (JISIC 2014), 37 (disponible en: http://www.aclweb.org/anthology/W14-6905 ).
Estoy implementando un sistema que podría detectar la emoción humana en el texto. ¿Hay conjuntos de datos anotados manualmente disponibles para el aprendizaje supervisado y las pruebas?