<p>Las redes sociales son el medio de comunicación más popular hoy en día, donde gente de todo el mundo se puede comunicar. El aumento de los índices de violencia en estas plataformas ha sido exponencial, y día a día los usuarios siguen manteniendo su comportamiento. Twitter y sus usuarios han adquirido relevancia en el área del análisis de sentimiento la cual permite estudiar la intencionalidad de los tweets. En el caso particular de este proyecto de titulación, se estudian los tipos de aprendizaje de máquina y los algoritmos relacionados. Además, se desarrolló un prototipo, el cual contempla las Máquinas de Soporte Vectorial. Para poder llevar esto a cabo fue necesario recabar una gran cantidad de tweets y clasificarlos dependiendo su nivel de agresividad. Para probar el rendimiento de dicho prototipo se fueron variando diferentes parámetros - conjunto particionado-validación cruzada, n-gramas, penalización y uso de steamer. El Algoritmo diseñado tiene un acierto cercano al 99 por ciento al ocupar 3-gramas, junto a validación cruzada, y una penitencia de 10. Como trabajo futuro se podría considerar hacer un análisis específico de los distintos tipos de violencia presentes en las redes sociales, además realizar un análisis descriptivo de los datos utilizando una representación en base a n-gramas, identificando cuales son los bigramas y trigramas que se repiten con mayor frecuencia</p>
<p>Social networks are the most popular way of communication today, where people from all over the world can communicate. The increase in rates of violence in these platforms has been exponential, and day to day users continue their behavior.Twitter and its users have acquired relevance in the area of sentiment analysis which allows studying the intentionality of the tweets. In the particular case of this project, different types of machine learning and related algorithms are studied. In addition, it was developed a prototype, which contemplates support vector machines.To carry this out it was necessary to collect a lot of tweets and classify them depending on their level of aggressiveness.To test the performance of this prototype, different parameters were tuned as set partitioning-cross-validation, n-grams, penalty and steamer use. The designed algorithm has a 99 per cent success when dealing with 3-grams, along with cross-validation, and a penance of 10. As future work,it could be considered to make a specific analysis of the different types of violence present in social networks,In addition perform a descriptive analysis of the data using a representation based on n-grams, identifying which are the bigrams and trigrams that are repeated more frequently</p>
last modification
Licenciado en Ciencias de la Ingeniería
Ingeniero Civil en Informáticatítulo
INGENIERIA CIVIL INFORMATICA
<p>Las redes sociales son el medio de comunicación más popular hoy en día, donde gente de todo el mundo se puede comunicar. El aumento de los índices de violencia en estas plataformas ha sido exponencial, y día a día los usuarios siguen manteniendo su comportamiento. Twitter y sus usuarios han adquirido relevancia en el área del análisis de sentimiento la cual permite estudiar la intencionalidad de los tweets. En el caso particular de este proyecto de titulación, se estudian los tipos de aprendizaje de máquina y los algoritmos relacionados. Además, se desarrolló un prototipo, el cual contempla las Máquinas de Soporte Vectorial. Para poder llevar esto a cabo fue necesario recabar una gran cantidad de tweets y clasificarlos dependiendo su nivel de agresividad. Para probar el rendimiento de dicho prototipo se fueron variando diferentes parámetros - conjunto particionado-validación cruzada, n-gramas, penalización y uso de steamer. El Algoritmo diseñado tiene un acierto cercano al 99 por ciento al ocupar 3-gramas, junto a validación cruzada, y una penitencia de 10. Como trabajo futuro se podría considerar hacer un análisis específico de los distintos tipos de violencia presentes en las redes sociales, además realizar un análisis descriptivo de los datos utilizando una representación en base a n-gramas, identificando cuales son los bigramas y trigramas que se repiten con mayor frecuencia</p>
<p>Social networks are the most popular way of communication today, where people from all over the world can communicate. The increase in rates of violence in these platforms has been exponential, and day to day users continue their behavior.Twitter and its users have acquired relevance in the area of sentiment analysis which allows studying the intentionality of the tweets. In the particular case of this project, different types of machine learning and related algorithms are studied. In addition, it was developed a prototype, which contemplates support vector machines.To carry this out it was necessary to collect a lot of tweets and classify them depending on their level of aggressiveness.To test the performance of this prototype, different parameters were tuned as set partitioning-cross-validation, n-grams, penalty and steamer use. The designed algorithm has a 99 per cent success when dealing with 3-grams, along with cross-validation, and a penance of 10. As future work,it could be considered to make a specific analysis of the different types of violence present in social networks,In addition perform a descriptive analysis of the data using a representation based on n-grams, identifying which are the bigrams and trigrams that are repeated more frequently</p>