Professional Documents
Culture Documents
• aprendizaje o el entrenamiento, y
• testeo.
Algoritmo Base
Adaptado del método de Pang y Lee
• Tokenización:
• puntuación como objetos léxicos diferentes y
• no utilizan raíces (stem) ni listas de palabras vacías (stopwords).
• Extracción de características:
• características como unigramas, bigramas,
• etiquetas de partes del habla (POS), y una combinación de esas características.
• Clasificador
• Tres métodos de aprendizaje automático.
• Naive Bayes, Entropía Máxima, y Clasificadores de Máquina de Vectores de Apoyo.
Análisis de Sentimientos Supervisado:
Conclusiones
• análisis de sentimiento es un análisis más difícil que la categorización.
• Algunas veces utilizar solo los adjetivos funciona mejor y algunas veces es
mejor utilizar todas las palabras.
• Depende del conjunto de datos.
• Unigrams o frases
Negación
• La negación es una construcción lingüística muy común que afecta la
polaridad
• La polaridad se puede expresar con la palabra gustar, una expresión
polar.
• Expresiones como gustar o horrible transmiten una polaridad.
• La negación de una palabra
• Ejemplos
• Me gusta+ el nuevo modelo de Nokia
• [No me gusta+]- el nuevo modelo de Nokia
Negación
1. Asignarle una categoría gramatical, de manera que si aparece
cercano con una palabra con un fuerte sentimiento, esta pasa a ser su
opuesto.