Bibliotecas PUCV

Un framework para la detección de fraude por subvaloración de productos mediante técnicas de minería de texto y datos

Repositorio Dspace/Manakin

Buscar en DSpace


Búsqueda avanzada

Mostrar el registro sencillo del ítem

dc.contributor Martí Lara, José Luis
dc.creator Suárez Pizarro, Luis Alberto
Fecha Ingreso dc.date.accessioned 2021-10-20T00:00:07Z
Fecha Disponible dc.date.available 2021-10-20T00:00:07Z
Fecha en Repositorio dc.date.issued 2021-10-19
Resumen dc.description <p>El presente trabajo pretende demostrar que por medio de la utilizaci&oacute;n conjunta de t&eacute;cnicas de miner&iacute;a de texto y datos es posible enriquecer un proceso de clasificaci&oacute;n orientado a la detecci&oacute;n de fraude, espec&iacute;ficamente, aquel asociado a la subvaloraci&oacute;n de productos importados. El estudio se centra en la definici&oacute;n de un framework que utiliza t&eacute;cnicas de miner&iacute;a de texto para la clasificaci&oacute;n de productos, a partir de la descripci&oacute;n de &eacute;stos, la cual se encuentra como texto no estructurado, donde se realiza una descripci&oacute;n en lenguaje natural para definir las caracter&iacute;sticas de los productos. Posteriormente, los productos identificados a partir de la clasificaci&oacute;n anterior, pasan por un proceso de miner&iacute;a de datos con el fin de generar agrupamientos en base a atributos de inter&eacute;s, para poder identificar elementos con alta probabilidad de fraude utilizando t&eacute;cnicas de detecci&oacute;n de outliers</p>
Resumen dc.description <p>This thesis tries to prove that, through the use of techniques of text and data mining, it is possible to improve a classification process oriented to detect fraud, specifically the one associated to the undervaluation of imported products. This research focuses on the definition of a framework that could use text mining to classify products from their own description. Descriptions are in a state of unstructured text, and in order to define the product features, these are made in natural language. Subsequently, the identified products from these descriptions pass through a data mining process in order to generate clusters based on attributes of interest. The use of techniques of outlier detection allows to identify elements with high possibilities of fraud</p>
Resumen dc.description last modification
Resumen dc.description Magíster en Ingeniería Informática
Resumen dc.description MAGISTER EN INGENIERIA INFORMATICA
Resumen dc.description <p>El presente trabajo pretende demostrar que por medio de la utilizaci&oacute;n conjunta de t&eacute;cnicas de miner&iacute;a de texto y datos es posible enriquecer un proceso de clasificaci&oacute;n orientado a la detecci&oacute;n de fraude, espec&iacute;ficamente, aquel asociado a la subvaloraci&oacute;n de productos importados. El estudio se centra en la definici&oacute;n de un framework que utiliza t&eacute;cnicas de miner&iacute;a de texto para la clasificaci&oacute;n de productos, a partir de la descripci&oacute;n de &eacute;stos, la cual se encuentra como texto no estructurado, donde se realiza una descripci&oacute;n en lenguaje natural para definir las caracter&iacute;sticas de los productos. Posteriormente, los productos identificados a partir de la clasificaci&oacute;n anterior, pasan por un proceso de miner&iacute;a de datos con el fin de generar agrupamientos en base a atributos de inter&eacute;s, para poder identificar elementos con alta probabilidad de fraude utilizando t&eacute;cnicas de detecci&oacute;n de outliers</p>
Resumen dc.description <p>This thesis tries to prove that, through the use of techniques of text and data mining, it is possible to improve a classification process oriented to detect fraud, specifically the one associated to the undervaluation of imported products. This research focuses on the definition of a framework that could use text mining to classify products from their own description. Descriptions are in a state of unstructured text, and in order to define the product features, these are made in natural language. Subsequently, the identified products from these descriptions pass through a data mining process in order to generate clusters based on attributes of interest. The use of techniques of outlier detection allows to identify elements with high possibilities of fraud</p>
Formato dc.format PDF
Lenguaje dc.language spa
dc.rights autorizado
dc.source http://opac.pucv.cl/pucv_txt/txt-0000/UCF0317_01.pdf
Materia dc.subject Bases de datos
Materia dc.subject Gestión de la información
Materia dc.subject Data mining
Materia dc.subject Estadística matemática
Title dc.title Un framework para la detección de fraude por subvaloración de productos mediante técnicas de minería de texto y datos
Tipo dc.type texto


Archivos en el ítem

Archivos Tamaño Formato Ver

No hay archivos asociados a este ítem.

Este ítem aparece en la(s) siguiente(s) colección(ones)

Mostrar el registro sencillo del ítem