You are on page 1of 17

Análisis de Sentimientos

Análisis de Sentimientos: No Supervisado


• Wordnet
• A lexical database for English with emphasis on synonymy
• Nouns, verbs, adjectives and adjectives are grouped into synonym
sets
• Words are linked according to lexical and conceptual relations
(creating a “net”)
• Not specifically sentiment oriented, but has been used to help derive
sentiment
• http://wordnet.princeton.edu/
SentiWordNet
• A lexical resource for opinion mining
• Based on Wordnet synsets
• Each synset is assigned three sentiment
• scores: positivity, negativity, and objectivity
• http://sentiwordnet.isti.cnr.it/
Análisis de Sentimientos: No Supervisado
• SentiWordNet is a lexical resource for opinion mining which is publicly
available.
• SentiWordNet assigns to each synset of WordNet three sentiment
scores: positivity, negativity, objectivity.
Ejemplo
Whissell's Dictionary of Affective Language
• About 9000 words rated
• App:
• http://sail.usc.edu/~kazemzad/emotion_in_text_cgi/DAL_app/
Análisis de Sentimientos: Supervisado
• Igual que para la clasificación de documentos, el análisis de
sentimiento basado en aprendizaje supervisado tiene dos pasos.

• aprendizaje o el entrenamiento, y

• testeo.
Algoritmo Base
Adaptado del método de Pang y Lee
• Tokenización:
• puntuación como objetos léxicos diferentes y
• no utilizan raíces (stem) ni listas de palabras vacías (stopwords).
• Extracción de características:
• características como unigramas, bigramas,
• etiquetas de partes del habla (POS), y una combinación de esas características.
• Clasificador
• Tres métodos de aprendizaje automático.
• Naive Bayes, Entropía Máxima, y Clasificadores de Máquina de Vectores de Apoyo.
Análisis de Sentimientos Supervisado:
Conclusiones
• análisis de sentimiento es un análisis más difícil que la categorización.

• Lillian Lee y sus compañeros de la Universidad de Cornell.

• Estudiaron la clasificación de sentimientos en las críticas de películas.


Análisis de Sentimientos Supervisado:
Conclusiones
• análisis de sentimiento es un análisis más difícil que la categorización.

• Especialmente interesados en la detección de polaridad de las críticas.

• Predecir si la crítica de una película de IMDB era positiva o negativa.

• El conjunto de datos que utilizaron en el estudio está disponible


en www.cs.cornell.edu/people/pabo/movie-review-data.
Análisis de Sentimientos: Tokenización
Tema importante en el análisis de sentimiento.
• Conjunto de datos de sentimiento están en un formato como
• HTML, XML, o JSON.
• formato de Twitter (Nombres, hashtags, etc.)
• Mayúsculas
• convertir todas las palabras a mayúsculas y así facilitar el análisis de cada
palabra.
• Números de teléfono, fechas
• Emoticons
• muy importante en el análisis de sentimiento. Los mensajes en las redes
sociales contienen emoticons que tienen significado.
Análisis de Sentimientos: Tokenización
• tokenizadores y herramientas especiales para el análisis de
sentimiento con emoticonos.

• tokenizador de sentimientos de Christopher Potts


• http://sentiment.christopherpotts.net/tokenizing.html#sentiment

• tokenizador de Twitter de Brendan O'Connor.


• https://github.com/brendano/tweetmotif
Extracción Características para Clasificación
Sentimientos
1. Cómo tratar la negación?
• Ejemplo
• Me disgusta esta cámara.
VS
• Me gusta mucho esta cámara.

• La detección de negación es un área de investigación


• minería de texto.
• varias técnicas para resolver este problema.
Extracción Características para Clasificación
Sentimientos

2. Detección de la palabras a usar.


• ¿Debemos utilizar solo los adjetivos que expresan opinión, o todas las
palabras?

• Algunas veces utilizar solo los adjetivos funciona mejor y algunas veces es
mejor utilizar todas las palabras.
• Depende del conjunto de datos.
• Unigrams o frases
Negación
• La negación es una construcción lingüística muy común que afecta la
polaridad
• La polaridad se puede expresar con la palabra gustar, una expresión
polar.
• Expresiones como gustar o horrible transmiten una polaridad.
• La negación de una palabra
• Ejemplos
• Me gusta+ el nuevo modelo de Nokia
• [No me gusta+]- el nuevo modelo de Nokia
Negación
1. Asignarle una categoría gramatical, de manera que si aparece
cercano con una palabra con un fuerte sentimiento, esta pasa a ser su
opuesto.

• Por ejemplo, en el caso de “No me gusta…”, “gusta” representa un


sentimiento positivo, pero con el no, se “crea” el término “no-gusta”
que es su opuesto
• Excepciones
• “No dudo que la Nikon D7100 sea la mejor” o
• “No hay nada más agradable que manejar un Mercedes”
Negación
2. En algunos trabajos, en los que las palabras tienen asignado un
puntaje que va de -5 a 5, donde -5 es muy negativo y 5 muy positivo
• La presencia de negaciones tiene un trato especial. Si se detecta
alguna negación el valor absoluto del mensaje es disminuido en 1 y su
polaridad es revertida.
• La explicación detrás de esto es que usar la negación de una palabra
no es lo mismo que usar el término opuesto
• Ejemplo decir “no es malo” y decir “es bueno”, por lo que usar la negación
representa un sentimiento menos intenso que usar la palabra opuesta

You might also like