Un framework para la detección de fraude por subvaloración de productos mediante técnicas de minería de texto y datos

	dc.contributor	Martí Lara, José Luis
	dc.creator	Suárez Pizarro, Luis Alberto
Fecha Ingreso	dc.date.accessioned	2021-10-20T00:00:07Z
Fecha Disponible	dc.date.available	2021-10-20T00:00:07Z
Fecha en Repositorio	dc.date.issued	2021-10-19
Resumen	dc.description	<p>El presente trabajo pretende demostrar que por medio de la utilización conjunta de técnicas de minería de texto y datos es posible enriquecer un proceso de clasificación orientado a la detección de fraude, específicamente, aquel asociado a la subvaloración de productos importados. El estudio se centra en la definición de un framework que utiliza técnicas de minería de texto para la clasificación de productos, a partir de la descripción de éstos, la cual se encuentra como texto no estructurado, donde se realiza una descripción en lenguaje natural para definir las características de los productos. Posteriormente, los productos identificados a partir de la clasificación anterior, pasan por un proceso de minería de datos con el fin de generar agrupamientos en base a atributos de interés, para poder identificar elementos con alta probabilidad de fraude utilizando técnicas de detección de outliers</p>
Resumen	dc.description	<p>This thesis tries to prove that, through the use of techniques of text and data mining, it is possible to improve a classification process oriented to detect fraud, specifically the one associated to the undervaluation of imported products. This research focuses on the definition of a framework that could use text mining to classify products from their own description. Descriptions are in a state of unstructured text, and in order to define the product features, these are made in natural language. Subsequently, the identified products from these descriptions pass through a data mining process in order to generate clusters based on attributes of interest. The use of techniques of outlier detection allows to identify elements with high possibilities of fraud</p>
Resumen	dc.description	last modification
Resumen	dc.description	Magíster en Ingeniería Informática
Resumen	dc.description	MAGISTER EN INGENIERIA INFORMATICA
Resumen	dc.description	<p>El presente trabajo pretende demostrar que por medio de la utilización conjunta de técnicas de minería de texto y datos es posible enriquecer un proceso de clasificación orientado a la detección de fraude, específicamente, aquel asociado a la subvaloración de productos importados. El estudio se centra en la definición de un framework que utiliza técnicas de minería de texto para la clasificación de productos, a partir de la descripción de éstos, la cual se encuentra como texto no estructurado, donde se realiza una descripción en lenguaje natural para definir las características de los productos. Posteriormente, los productos identificados a partir de la clasificación anterior, pasan por un proceso de minería de datos con el fin de generar agrupamientos en base a atributos de interés, para poder identificar elementos con alta probabilidad de fraude utilizando técnicas de detección de outliers</p>
Resumen	dc.description	<p>This thesis tries to prove that, through the use of techniques of text and data mining, it is possible to improve a classification process oriented to detect fraud, specifically the one associated to the undervaluation of imported products. This research focuses on the definition of a framework that could use text mining to classify products from their own description. Descriptions are in a state of unstructured text, and in order to define the product features, these are made in natural language. Subsequently, the identified products from these descriptions pass through a data mining process in order to generate clusters based on attributes of interest. The use of techniques of outlier detection allows to identify elements with high possibilities of fraud</p>
Formato	dc.format	PDF
Lenguaje	dc.language	spa
	dc.rights	autorizado
	dc.source	http://opac.pucv.cl/pucv_txt/txt-0000/UCF0317_01.pdf
Materia	dc.subject	Bases de datos
Materia	dc.subject	Gestión de la información
Materia	dc.subject	Data mining
Materia	dc.subject	Estadística matemática
Title	dc.title	Un framework para la detección de fraude por subvaloración de productos mediante técnicas de minería de texto y datos
Tipo	dc.type	texto