Bibliotecas PUCV

Reconocimiento de agresión verbal en Twitter con el uso de patrones lingüísticos

Repositorio Dspace/Manakin

Buscar en DSpace


Búsqueda avanzada

Mostrar el registro sencillo del ítem

dc.contributor Villavicencio Alvarez, José Thomas
dc.contributor Roncagliolo De la Horra, Silvana Paola
dc.creator Rivera Contreras, Marcelo Enrique
Fecha Ingreso dc.date.accessioned 2021-10-21T13:21:50Z
Fecha Disponible dc.date.available 2021-10-21T13:21:50Z
Fecha en Repositorio dc.date.issued 2021-10-21
Resumen dc.description <p>Las redes sociales son el medio de comunicaci&oacute;n m&aacute;s popular hoy en d&iacute;a, donde gente de todo el mundo se puede comunicar. El aumento de los &iacute;ndices de violencia en estas plataformas ha sido exponencial, y d&iacute;a a d&iacute;a los usuarios siguen manteniendo su comportamiento. Twitter y sus usuarios han adquirido relevancia en el &aacute;rea del an&aacute;lisis de sentimiento la cual permite estudiar la intencionalidad de los tweets. En el caso particular de este proyecto de titulaci&oacute;n, se estudian los tipos de aprendizaje de m&aacute;quina y los algoritmos relacionados. Adem&aacute;s, se desarroll&oacute; un prototipo, el cual contempla las M&aacute;quinas de Soporte Vectorial. Para poder llevar esto a cabo fue necesario recabar una gran cantidad de tweets y clasificarlos dependiendo su nivel de agresividad. Para probar el rendimiento de dicho prototipo se fueron variando diferentes par&aacute;metros - conjunto particionado-validaci&oacute;n cruzada, n-gramas, penalizaci&oacute;n y uso de steamer. El Algoritmo dise&ntilde;ado tiene un acierto cercano al 99 por ciento al ocupar 3-gramas, junto a validaci&oacute;n cruzada, y una penitencia de 10. Como trabajo futuro se podr&iacute;a considerar hacer un an&aacute;lisis espec&iacute;fico de los distintos tipos de violencia presentes en las redes sociales, adem&aacute;s realizar un an&aacute;lisis descriptivo de los datos utilizando una representaci&oacute;n en base a n-gramas, identificando cuales son los bigramas y trigramas que se repiten con mayor frecuencia</p>
Resumen dc.description <p>Social networks are the most popular way of communication today, where people from all over the world can communicate. The increase in rates of violence in these platforms has been exponential, and day to day users continue their behavior.Twitter and its users have acquired relevance in the area of sentiment analysis which allows studying the intentionality of the tweets. In the particular case of this project, different types of machine learning and related algorithms are studied. In addition, it was developed a prototype, which contemplates support vector machines.To carry this out it was necessary to collect a lot of tweets and classify them depending on their level of aggressiveness.To test the performance of this prototype, different parameters were tuned as set partitioning-cross-validation, n-grams, penalty and steamer use. The designed algorithm has a 99 per cent success when dealing with 3-grams, along with cross-validation, and a penance of 10. As future work,it could be considered to make a specific analysis of the different types of violence present in social networks,In addition perform a descriptive analysis of the data using a representation based on n-grams, identifying which are the bigrams and trigrams that are repeated more frequently</p>
Resumen dc.description last modification
Resumen dc.description Licenciado en Ciencias de la Ingeniería
Resumen dc.description Ingeniero Civil en Informáticatítulo
Resumen dc.description INGENIERIA CIVIL INFORMATICA
Resumen dc.description <p>Las redes sociales son el medio de comunicaci&oacute;n m&aacute;s popular hoy en d&iacute;a, donde gente de todo el mundo se puede comunicar. El aumento de los &iacute;ndices de violencia en estas plataformas ha sido exponencial, y d&iacute;a a d&iacute;a los usuarios siguen manteniendo su comportamiento. Twitter y sus usuarios han adquirido relevancia en el &aacute;rea del an&aacute;lisis de sentimiento la cual permite estudiar la intencionalidad de los tweets. En el caso particular de este proyecto de titulaci&oacute;n, se estudian los tipos de aprendizaje de m&aacute;quina y los algoritmos relacionados. Adem&aacute;s, se desarroll&oacute; un prototipo, el cual contempla las M&aacute;quinas de Soporte Vectorial. Para poder llevar esto a cabo fue necesario recabar una gran cantidad de tweets y clasificarlos dependiendo su nivel de agresividad. Para probar el rendimiento de dicho prototipo se fueron variando diferentes par&aacute;metros - conjunto particionado-validaci&oacute;n cruzada, n-gramas, penalizaci&oacute;n y uso de steamer. El Algoritmo dise&ntilde;ado tiene un acierto cercano al 99 por ciento al ocupar 3-gramas, junto a validaci&oacute;n cruzada, y una penitencia de 10. Como trabajo futuro se podr&iacute;a considerar hacer un an&aacute;lisis espec&iacute;fico de los distintos tipos de violencia presentes en las redes sociales, adem&aacute;s realizar un an&aacute;lisis descriptivo de los datos utilizando una representaci&oacute;n en base a n-gramas, identificando cuales son los bigramas y trigramas que se repiten con mayor frecuencia</p>
Resumen dc.description <p>Social networks are the most popular way of communication today, where people from all over the world can communicate. The increase in rates of violence in these platforms has been exponential, and day to day users continue their behavior.Twitter and its users have acquired relevance in the area of sentiment analysis which allows studying the intentionality of the tweets. In the particular case of this project, different types of machine learning and related algorithms are studied. In addition, it was developed a prototype, which contemplates support vector machines.To carry this out it was necessary to collect a lot of tweets and classify them depending on their level of aggressiveness.To test the performance of this prototype, different parameters were tuned as set partitioning-cross-validation, n-grams, penalty and steamer use. The designed algorithm has a 99 per cent success when dealing with 3-grams, along with cross-validation, and a penance of 10. As future work,it could be considered to make a specific analysis of the different types of violence present in social networks,In addition perform a descriptive analysis of the data using a representation based on n-grams, identifying which are the bigrams and trigrams that are repeated more frequently</p>
Formato dc.format PDF
Formato dc.format JEPG
Lenguaje dc.language spa
dc.rights autorizado
dc.source http://opac.pucv.cl/pucv_txt/txt-8000/UCC8097_01.pdf
dc.source http://opac.pucv.cl/pucv_img/Img-8000/UCC8097_01.jpg
Materia dc.subject REDES NEURONALES
Materia dc.subject INTELIGENCIA ARTIFICIAL
Materia dc.subject APRENDIZAJE POR MAQUINAS
Title dc.title Reconocimiento de agresión verbal en Twitter con el uso de patrones lingüísticos
Tipo dc.type texto


Archivos en el ítem

Archivos Tamaño Formato Ver

No hay archivos asociados a este ítem.

Este ítem aparece en la(s) siguiente(s) colección(ones)

Mostrar el registro sencillo del ítem