Desarrollo de un sistema de clasificación binaria automática de noticias con máquinas de aprendizaje

Desarrollo de un sistema de clasificación binaria automática de noticias con máquinas de aprendizaje

Autor(es):

Holts Corey, Alberto Alejandro

Colaborador(es):

Riquelme Jerez, Claudio Luis; Alfaro Arancibia, Rodrigo Marcelo; Cabrera Guerrero, Guillermo Nicolás

Disponible vía

Materia:

Análisis de datos - CLASIFICACION AUTOMATICA - Algoritmos - PROGRAMAS

Descripción:

El almacenamiento de documentos en formato digital y el enorme y creciente volumen de información existente en la web traen consigo la necesidad de recopilarla de tal manera que su acceso sea organizado y rápido, la mejor manera de alcanzarlo es realizando una clasificación sobre la información recopilada.La tarea de realizar una clasificación de forma manual (por parte de expertos humanos) es un proceso tedioso, lento y costoso, es por ello que surge la problemática de desarrollar una clasificación automática de texto.El objetivo de esta investigación es resolver el problema de la clasificación automática aplicada al caso específico de la clasificación de noticias, haciendo una clasificación binaria mediante el uso de máquinas de aprendizaje.El presente informe de trabajo de título detalla el proceso de investigación llevado a cabo para desarrollar una herramienta que permita entrenar una máquina de aprendizaje y luego ser usada para clasificar documentos. Para ello se describen las definiciones de máquinas de aprendizaje y clasificación de texto. Se exponen las distintas técnicas para clasificar y se presentan los resultados de pruebas realizadas para optar por la mejor técnica. Finalmente se describe el sistema que realiza esta clasificación y se presentan resultados de su clasificación

The increased availability of documents in digital format available on the web contain useful information for different purposes, this carries an important need to organize them.The classification task achieved manually (by humans experts), is tedious, slow and expensive, that‟s why the problem is the developing of an automatic text classification.The goal of this research is to solve the problem of automatic classification applied to the specific case of classifying news by making a binary classification using machine learning techniques.This report details the investigation process carried out to develop a tool to train a machine learning algorithm and then be used to classify documents. Describes the definition of machine learning and text classification. Describes the various techniques for automated text classification and shows the results of testing, to choose the best techniques. Finally describes the system that performs this classification and the results of it

last modification

Ingeniero de Ejecución en Informática

INGENIERIA DE EJECUCION INFORMATICA

Mostrar el registro completo del ítem

Archivos en el ítem

Archivos	Tamaño	Formato	Ver
No hay archivos asociados a este ítem.

Desarrollo de un sistema de clasificación binaria automática de noticias con máquinas de aprendizaje

Repositorio Dspace/Manakin

Buscar en DSpace

Desarrollo de un sistema de clasificación binaria automática de noticias con máquinas de aprendizaje

Descripción:

Archivos en el ítem

Este ítem aparece en la(s) siguiente(s) colección(ones)

Listar

Todo DSpace

Esta colección

Mi cuenta