Bibliotecas PUCV

Desarrollo de un sistema de clasificación binaria automática de noticias con máquinas de aprendizaje

Repositorio Dspace/Manakin

Buscar en DSpace


Búsqueda avanzada

Mostrar el registro sencillo del ítem

dc.contributor Riquelme Jerez, Claudio Luis
dc.contributor Alfaro Arancibia, Rodrigo Marcelo
dc.contributor Cabrera Guerrero, Guillermo Nicolás
dc.creator Holts Corey, Alberto Alejandro
Fecha Ingreso dc.date.accessioned 2021-10-19T23:28:42Z
Fecha Disponible dc.date.available 2021-10-19T23:28:42Z
Fecha en Repositorio dc.date.issued 2021-10-19
Resumen dc.description <p>El almacenamiento de documentos en formato digital y el enorme y creciente volumen de informaci&oacute;n existente en la web traen consigo la necesidad de recopilarla de tal manera que su acceso sea organizado y r&aacute;pido, la mejor manera de alcanzarlo es realizando una clasificaci&oacute;n sobre la informaci&oacute;n recopilada.</p><p>La tarea de realizar una clasificaci&oacute;n de forma manual (por parte de expertos humanos) es un proceso tedioso, lento y costoso, es por ello que surge la problem&aacute;tica de desarrollar una clasificaci&oacute;n autom&aacute;tica de texto.</p><p>El objetivo de esta investigaci&oacute;n es resolver el problema de la clasificaci&oacute;n autom&aacute;tica aplicada al caso espec&iacute;fico de la clasificaci&oacute;n de noticias, haciendo una clasificaci&oacute;n binaria mediante el uso de m&aacute;quinas de aprendizaje.</p><p>El presente informe de trabajo de t&iacute;tulo detalla el proceso de investigaci&oacute;n llevado a cabo para desarrollar una herramienta que permita entrenar una m&aacute;quina de aprendizaje y luego ser usada para clasificar documentos. Para ello se describen las definiciones de m&aacute;quinas de aprendizaje y clasificaci&oacute;n de texto. Se exponen las distintas t&eacute;cnicas para clasificar y se presentan los resultados de pruebas realizadas para optar por la mejor t&eacute;cnica. Finalmente se describe el sistema que realiza esta clasificaci&oacute;n y se presentan resultados de su clasificaci&oacute;n</p>
Resumen dc.description <p>The increased availability of documents in digital format available on the web contain useful information for different purposes, this carries an important need to organize them.</p><p>The classification task achieved manually (by humans experts), is tedious, slow and expensive, that&#8223;s why the problem is the developing of an automatic text classification.</p><p>The goal of this research is to solve the problem of automatic classification applied to the specific case of classifying news by making a binary classification using machine learning techniques.</p><p>This report details the investigation process carried out to develop a tool to train a machine learning algorithm and then be used to classify documents. Describes the definition of machine learning and text classification. Describes the various techniques for automated text classification and shows the results of testing, to choose the best techniques. Finally describes the system that performs this classification and the results of it</p>
Resumen dc.description last modification
Resumen dc.description Ingeniero de Ejecución en Informática
Resumen dc.description INGENIERIA DE EJECUCION INFORMATICA
Resumen dc.description <p>El almacenamiento de documentos en formato digital y el enorme y creciente volumen de informaci&oacute;n existente en la web traen consigo la necesidad de recopilarla de tal manera que su acceso sea organizado y r&aacute;pido, la mejor manera de alcanzarlo es realizando una clasificaci&oacute;n sobre la informaci&oacute;n recopilada.</p><p>La tarea de realizar una clasificaci&oacute;n de forma manual (por parte de expertos humanos) es un proceso tedioso, lento y costoso, es por ello que surge la problem&aacute;tica de desarrollar una clasificaci&oacute;n autom&aacute;tica de texto.</p><p>El objetivo de esta investigaci&oacute;n es resolver el problema de la clasificaci&oacute;n autom&aacute;tica aplicada al caso espec&iacute;fico de la clasificaci&oacute;n de noticias, haciendo una clasificaci&oacute;n binaria mediante el uso de m&aacute;quinas de aprendizaje.</p><p>El presente informe de trabajo de t&iacute;tulo detalla el proceso de investigaci&oacute;n llevado a cabo para desarrollar una herramienta que permita entrenar una m&aacute;quina de aprendizaje y luego ser usada para clasificar documentos. Para ello se describen las definiciones de m&aacute;quinas de aprendizaje y clasificaci&oacute;n de texto. Se exponen las distintas t&eacute;cnicas para clasificar y se presentan los resultados de pruebas realizadas para optar por la mejor t&eacute;cnica. Finalmente se describe el sistema que realiza esta clasificaci&oacute;n y se presentan resultados de su clasificaci&oacute;n</p>
Resumen dc.description <p>The increased availability of documents in digital format available on the web contain useful information for different purposes, this carries an important need to organize them.</p><p>The classification task achieved manually (by humans experts), is tedious, slow and expensive, that&#8223;s why the problem is the developing of an automatic text classification.</p><p>The goal of this research is to solve the problem of automatic classification applied to the specific case of classifying news by making a binary classification using machine learning techniques.</p><p>This report details the investigation process carried out to develop a tool to train a machine learning algorithm and then be used to classify documents. Describes the definition of machine learning and text classification. Describes the various techniques for automated text classification and shows the results of testing, to choose the best techniques. Finally describes the system that performs this classification and the results of it</p>
Formato dc.format PDF
Lenguaje dc.language spa
dc.rights autorizado
dc.source http://opac.pucv.cl/pucv_txt/txt-5000/UCG5466_01.pdf
Materia dc.subject Análisis de datos
Materia dc.subject CLASIFICACION AUTOMATICA
Materia dc.subject Algoritmos
Materia dc.subject PROGRAMAS
Title dc.title Desarrollo de un sistema de clasificación binaria automática de noticias con máquinas de aprendizaje
Tipo dc.type texto


Archivos en el ítem

Archivos Tamaño Formato Ver

No hay archivos asociados a este ítem.

Este ítem aparece en la(s) siguiente(s) colección(ones)

Mostrar el registro sencillo del ítem