dictionary - tesis - sentiwordnet
Diccionarios de análisis de sentimiento (8)
Léxico de Análisis de Sentimiento (Minería de Opinión)
- Léxico de subjetividad de MPQA
- Léxico del Sentimiento Hu de Bing Liu y Minqing
- SentiWordNet (Incluido en NLTK )
- VADER Sentiment Lexicon
- SenticNet
- LIWC (no gratis)
- Harvard Inquirer
- ANEW
Fuentes:
- Keenformatics - Léxicos y conjuntos de datos de análisis de sentimiento (mi blog)
- Hutto, CJ y Eric Gilbert. "Vader: un modelo parsimonioso basado en reglas para el análisis del sentimiento del texto de las redes sociales". Octava Conferencia Internacional AAAI sobre Weblogs y Redes Sociales. 2014.
- Simposio de Sentimiento Tutorial de Christopher Potts
- Experiencia personal
Me preguntaba si alguien sabía dónde podía obtener diccionarios de palabras positivas y negativas. Estoy investigando el análisis de sentimientos y esta es una parte crucial de esto.
El Sentiment Lexicon de la Universidad de Pittsburgh podría ser lo que buscas. Es un léxico de aproximadamente 8,000 palabras con sentimiento positivo / neutral / negativo. Se describe con más detalle en este documento y se publica bajo la GPL.
El directorio de diccionarios de Harvard-IV http://www.wjh.harvard.edu/~inquirer/homecat.htm tiene al menos dos conjuntos de diccionarios listos para usar con orientación positiva / negativa.
El profesor Bing Liu proporciona un léxico en inglés de aproximadamente 6800 palabras, puede descargar desde este enlace: Minería de opinión, Análisis de opinión y Detección de spam de opinión
Llegando un poco tarde, solo notare que los diccionarios tienen una contribución limitada para el análisis de sentimientos. Algunos sentimientos que contienen oraciones no contienen ninguna palabra de "sentimiento", por ejemplo, "leer el libro", que podría ser positivo en una reseña de un libro mientras que es negativo en una reseña de una película. De manera similar, la palabra de sentimiento "impredecible" podría ser positiva en el contexto de un thriller pero negativa al describir el sistema de interrupciones del Toyota.
Y hay muchos más...
Puede usar el léxico de sentimiento de vader
from nltk.sentiment.vader import SentimentIntensityAnalyzer
sentence=''APPle is good for health''
sid = SentimentIntensityAnalyzer()
ss = sid.polarity_scores(sentence)
print(ss)
le dará la polaridad de la oración.
salida:
{''compound'': 0.4404, ''neu'': 0.58, ''pos'': 0.42, ''neg'': 0.0}
Este documento de 2002 describe un algoritmo para derivar dicho diccionario a partir de muestras de texto de forma automática, utilizando solo dos palabras como conjunto inicial.
AFINN puedes encontrarlo aquí y también crearlo dinámicamente. Al igual que cada vez que se agrega una palabra desconocida + ve, añádelo con +1. Al igual que el banano es una nueva palabra + ve y aparece dos veces, se convertirá en +2.
¡Cuantos artículos y datos cree que su diccionario se volverá más fuerte!