<p>El almacenamiento de documentos en formato digital y el enorme y creciente volumen de información existente en la web traen consigo la necesidad de recopilarla de tal manera que su acceso sea organizado y rápido, la mejor manera de alcanzarlo es realizando una clasificación sobre la información recopilada.</p><p>La tarea de realizar una clasificación de forma manual (por parte de expertos humanos) es un proceso tedioso, lento y costoso, es por ello que surge la problemática de desarrollar una clasificación automática de texto.</p><p>El objetivo de esta investigación es resolver el problema de la clasificación automática aplicada al caso específico de la clasificación de noticias, haciendo una clasificación binaria mediante el uso de máquinas de aprendizaje.</p><p>El presente informe de trabajo de título detalla el proceso de investigación llevado a cabo para desarrollar una herramienta que permita entrenar una máquina de aprendizaje y luego ser usada para clasificar documentos. Para ello se describen las definiciones de máquinas de aprendizaje y clasificación de texto. Se exponen las distintas técnicas para clasificar y se presentan los resultados de pruebas realizadas para optar por la mejor técnica. Finalmente se describe el sistema que realiza esta clasificación y se presentan resultados de su clasificación</p>
<p>The increased availability of documents in digital format available on the web contain useful information for different purposes, this carries an important need to organize them.</p><p>The classification task achieved manually (by humans experts), is tedious, slow and expensive, that‟s why the problem is the developing of an automatic text classification.</p><p>The goal of this research is to solve the problem of automatic classification applied to the specific case of classifying news by making a binary classification using machine learning techniques.</p><p>This report details the investigation process carried out to develop a tool to train a machine learning algorithm and then be used to classify documents. Describes the definition of machine learning and text classification. Describes the various techniques for automated text classification and shows the results of testing, to choose the best techniques. Finally describes the system that performs this classification and the results of it</p>
last modification
Ingeniero de Ejecución en Informática
INGENIERIA DE EJECUCION INFORMATICA
<p>El almacenamiento de documentos en formato digital y el enorme y creciente volumen de información existente en la web traen consigo la necesidad de recopilarla de tal manera que su acceso sea organizado y rápido, la mejor manera de alcanzarlo es realizando una clasificación sobre la información recopilada.</p><p>La tarea de realizar una clasificación de forma manual (por parte de expertos humanos) es un proceso tedioso, lento y costoso, es por ello que surge la problemática de desarrollar una clasificación automática de texto.</p><p>El objetivo de esta investigación es resolver el problema de la clasificación automática aplicada al caso específico de la clasificación de noticias, haciendo una clasificación binaria mediante el uso de máquinas de aprendizaje.</p><p>El presente informe de trabajo de título detalla el proceso de investigación llevado a cabo para desarrollar una herramienta que permita entrenar una máquina de aprendizaje y luego ser usada para clasificar documentos. Para ello se describen las definiciones de máquinas de aprendizaje y clasificación de texto. Se exponen las distintas técnicas para clasificar y se presentan los resultados de pruebas realizadas para optar por la mejor técnica. Finalmente se describe el sistema que realiza esta clasificación y se presentan resultados de su clasificación</p>
<p>The increased availability of documents in digital format available on the web contain useful information for different purposes, this carries an important need to organize them.</p><p>The classification task achieved manually (by humans experts), is tedious, slow and expensive, that‟s why the problem is the developing of an automatic text classification.</p><p>The goal of this research is to solve the problem of automatic classification applied to the specific case of classifying news by making a binary classification using machine learning techniques.</p><p>This report details the investigation process carried out to develop a tool to train a machine learning algorithm and then be used to classify documents. Describes the definition of machine learning and text classification. Describes the various techniques for automated text classification and shows the results of testing, to choose the best techniques. Finally describes the system that performs this classification and the results of it</p>