<p>Twitter es una plataforma de microbloggeo donde usuarios comparten sus opiniones con una restricción en la cantidad de caracteres. Dadas las características sociales de Twitter, es una fuente potencial para poder realizar análisis de sentimiento. Dada esta misma razón, opiniones sobre ciertos sujetos tales como personas o marcas pueden cambiar en cortos periodos de tiempo. Un enfoque tradicional en la implementación de un clasificador de sentimientos tiene un rendimiento pobre, debido a que depende de cómo fue entrenado dicho clasificador. Se propone un método novedoso para enfrentar este problema, con la implementación de un sistema multi-agentes para clasificar y un mecanismo de análisis de corpus para el re-entrenamiento del clasificador. Este mecanismo consiste en un agente crítico el cual compara el corpus entrenado por el agente clasificador, con nuevos corpus de documentos de futuras instancias, usando principalmente dos métodos: análisis de t-student y diferencias de histogramas. Un clasificador basado en Naïve Bayes fue implementado junto a este mecanismo con múltiples configuraciones. Los resultados de la experimentación muestran que el mecanismo mejora el rendimiento, cuando es comparado con un clasificador Naive Bayes sin el uso de este mecanismo</p>
<p>Twitter is a microblogging platform where users share opinions with a restricted amount of characters. Given the social characteristic of Twitter, it is a potential source for sentiment analysis. For this same reason, opinions of certain subjects such as people or brands can change in short periods of time. A traditional approach of a sentiment classifier implementation performs poorly since it depends on how it is trained. We propose a novel method for tackling this problem, with the implementation of a multi-agent system for classifying and corpus analysis mechanism for retraining the classifier. This mechanism consists of a critic agent which comparing the trained corpus of the classifier agent with new collections of documents from future time steps, using primarily two methods: t-student analysis and histogram differences. A Naïve- Bayes based classifier was implemented with this mechanism with multiple configurations. The results of experimental data show that the mechanism boosts its performance, when compared to a pure Naïve Bayes classifier</p>
last modification
Licenciado en Ciencias de la Ingeniería
Ingeniero Civil en Informáticatítulo
INGENIERIA CIVIL INFORMATICA
<p>Twitter es una plataforma de microbloggeo donde usuarios comparten sus opiniones con una restricción en la cantidad de caracteres. Dadas las características sociales de Twitter, es una fuente potencial para poder realizar análisis de sentimiento. Dada esta misma razón, opiniones sobre ciertos sujetos tales como personas o marcas pueden cambiar en cortos periodos de tiempo. Un enfoque tradicional en la implementación de un clasificador de sentimientos tiene un rendimiento pobre, debido a que depende de cómo fue entrenado dicho clasificador. Se propone un método novedoso para enfrentar este problema, con la implementación de un sistema multi-agentes para clasificar y un mecanismo de análisis de corpus para el re-entrenamiento del clasificador. Este mecanismo consiste en un agente crítico el cual compara el corpus entrenado por el agente clasificador, con nuevos corpus de documentos de futuras instancias, usando principalmente dos métodos: análisis de t-student y diferencias de histogramas. Un clasificador basado en Naïve Bayes fue implementado junto a este mecanismo con múltiples configuraciones. Los resultados de la experimentación muestran que el mecanismo mejora el rendimiento, cuando es comparado con un clasificador Naive Bayes sin el uso de este mecanismo</p>
<p>Twitter is a microblogging platform where users share opinions with a restricted amount of characters. Given the social characteristic of Twitter, it is a potential source for sentiment analysis. For this same reason, opinions of certain subjects such as people or brands can change in short periods of time. A traditional approach of a sentiment classifier implementation performs poorly since it depends on how it is trained. We propose a novel method for tackling this problem, with the implementation of a multi-agent system for classifying and corpus analysis mechanism for retraining the classifier. This mechanism consists of a critic agent which comparing the trained corpus of the classifier agent with new collections of documents from future time steps, using primarily two methods: t-student analysis and histogram differences. A Naïve- Bayes based classifier was implemented with this mechanism with multiple configurations. The results of experimental data show that the mechanism boosts its performance, when compared to a pure Naïve Bayes classifier</p>