<p>Hoy en día se encuentra una gran cantidad de datos e información a disposición de las personas a través de distintos medios electrónicos, bibliotecas digitales, colecciones de documentos e internet por nombrar los medios más comunes. Lo anterior provoca la necesidad de un desglose de documentos efectivo, debido a que la cantidad existentes de estos es innumerable. Dicho lo anterior se debe manifestar que realizar la clasificación de forma manual seria costoso y conllevaría una gran cantidad de tiempo. Por ello diversas técnicas para manipular la información se han ido planteando, dentro de la que se encuentra la clasificación de texto para realizar una búsqueda de manera eficiente. Sin embargo, a los inconvenientes antes mencionados, se agrega el crecimiento constante de la información, todo esto convierte a dicha tarea algo tediosa y compleja de realizar, por lo que ésta clasificación busca ser de manera automática. El presente documento abarcara técnicas, enfoques para clasificar los textos con el fin de poder reducir los tiempos de búsqueda y en este último punto será el central del proyecto, ya que se espera lograr una mayor exactitud a la hora de buscar una similitud en los textos o simplemente encontrar la mejor alternativa requerida mediante una comparación por resúmenes</p>
<p>Today there is a lot of data and information available to people through various electronic media, digital libraries, document collections and internet to name the most common means. The above causes the need for an effective document breakdown, because the existing amount of these is innumerable. Having said that, it should be stated that the classification of the manual would be expensive and would take a lot of time. For that reason diverse techniques to manipulate the information have been raised, within which is the classification of text to carry out a search of efficient way. However, to the aforementioned drawbacks, the constant growth of information is added, all of which makes this task a tedious and complex task, so that this classification seeks to be automatic. The present document will cover techniques, approaches to classify texts in order to reduce the search times and in this last point will be the center of the project, since it is expected to achieve greater accuracy in the search for similarity in texts Or simply find the best alternative required by comparing by summaries</p>
last modification
Ingeniero Civil en Informática
INGENIERIA CIVIL INFORMATICA
<p>Hoy en día se encuentra una gran cantidad de datos e información a disposición de las personas a través de distintos medios electrónicos, bibliotecas digitales, colecciones de documentos e internet por nombrar los medios más comunes. Lo anterior provoca la necesidad de un desglose de documentos efectivo, debido a que la cantidad existentes de estos es innumerable. Dicho lo anterior se debe manifestar que realizar la clasificación de forma manual seria costoso y conllevaría una gran cantidad de tiempo. Por ello diversas técnicas para manipular la información se han ido planteando, dentro de la que se encuentra la clasificación de texto para realizar una búsqueda de manera eficiente. Sin embargo, a los inconvenientes antes mencionados, se agrega el crecimiento constante de la información, todo esto convierte a dicha tarea algo tediosa y compleja de realizar, por lo que ésta clasificación busca ser de manera automática. El presente documento abarcara técnicas, enfoques para clasificar los textos con el fin de poder reducir los tiempos de búsqueda y en este último punto será el central del proyecto, ya que se espera lograr una mayor exactitud a la hora de buscar una similitud en los textos o simplemente encontrar la mejor alternativa requerida mediante una comparación por resúmenes</p>
<p>Today there is a lot of data and information available to people through various electronic media, digital libraries, document collections and internet to name the most common means. The above causes the need for an effective document breakdown, because the existing amount of these is innumerable. Having said that, it should be stated that the classification of the manual would be expensive and would take a lot of time. For that reason diverse techniques to manipulate the information have been raised, within which is the classification of text to carry out a search of efficient way. However, to the aforementioned drawbacks, the constant growth of information is added, all of which makes this task a tedious and complex task, so that this classification seeks to be automatic. The present document will cover techniques, approaches to classify texts in order to reduce the search times and in this last point will be the center of the project, since it is expected to achieve greater accuracy in the search for similarity in texts Or simply find the best alternative required by comparing by summaries</p>