Bibliotecas PUCV

Data quality para la migración de una base de datos orientada a columnas

Repositorio Dspace/Manakin

Buscar en DSpace


Búsqueda avanzada

Mostrar el registro sencillo del ítem

dc.contributor Salinas Orellana, Juan Carlos Martín
dc.contributor Rubio León, José Miguel
dc.contributor Crawford Labrín, Broderick
dc.creator Herrera Guzmán, Juan Pablo
Fecha Ingreso dc.date.accessioned 2021-10-20T19:37:13Z
Fecha Disponible dc.date.available 2021-10-20T19:37:13Z
Fecha en Repositorio dc.date.issued 2021-10-20
Resumen dc.description <p>Este informe de proyecto describe la implementaci&oacute;n de un marco metodol&oacute;gico para el desarrollo de proyectos de calidad de datos.Si bien un proyecto de calidad de datos es un proceso lleno de casu&iacute;sticas y particularidades que dificultan en gran medida concebir alg&uacute;n tipo de generalizaci&oacute;n, hemos querido plasmar en el desarrollo de este trabajo un esbozo de lo que pudiera perfilarse como una metodolog&iacute;a a la hora de abordar problemas de esta naturaleza.Aspectos como la correcta tipificaci&oacute;n de los datos y sus dominios, contar con un conjunto de reglas y t&eacute;cnicas que permitan la correcci&oacute;n, homologaci&oacute;n y eliminaci&oacute;n de valores err&oacute;neos, as&iacute; como criterios de evaluaci&oacute;n acerca de la bondad de las mismas son parte de lo que queremos proponer como marco de trabajo.Los datos a analizar son el resultado de un proceso llevado a cabo en el contexto de un proyecto de migraci&oacute;n de base de datos de una empresa de servicios el&eacute;ctricos.Se definen e implementan las mediciones de calidad a realizar sobre la base de datos, y se establece la forma de registrar los resultados de las mismas. Luego se definen e implementan procesos de limpieza -autom&aacute;ticos y semiautom&aacute;ticos- con el fin de corregir los errores detectados. Para las implementaciones se utilizan sentencias SQL, obteniendo como resultado un Script que automatiza el ciclo completo de la calidad de datos: medici&oacute;n, registro y limpieza necesaria para llevar a cabo la migraci&oacute;n de la base de datos</p>
Resumen dc.description <p>This project report describes the implementation of a methodological framework for the development of data quality projects. While a quality project data is full of casuistry and special process that make it very difficult to conceive of any kind of generalization, we wanted to capture in the development of this paper an outline of what might emerge as a methodology when addressing problems of this nature. Aspects such as the correct classification of the data and their domains, have a set of rules and techniques to enable correction, approval and removal of erroneous values and evaluation criteria of the goodness of these are part of what we want propose as a framework. The data analyzed are the result of a process carried out in the context of a migration project database of electric utility.They are defined and implemented quality measurements to be performed on the database, and how to record the results of the same set. Then they define and implement cleaning processes -automatic and semiautomatic- in order to correct the errors found.For implementations SQL statements are used, resulting in a script that automates the full cycle of data quality: measurement, registration and cleaning required to perform the migration of the database</p>
Resumen dc.description last modification
Resumen dc.description Licenciado en Ciencias de la Ingeniería
Resumen dc.description Ingeniero Civil en Informáticatítulo
Resumen dc.description INGENIERIA CIVIL INFORMATICA
Resumen dc.description <p>Este informe de proyecto describe la implementaci&oacute;n de un marco metodol&oacute;gico para el desarrollo de proyectos de calidad de datos.Si bien un proyecto de calidad de datos es un proceso lleno de casu&iacute;sticas y particularidades que dificultan en gran medida concebir alg&uacute;n tipo de generalizaci&oacute;n, hemos querido plasmar en el desarrollo de este trabajo un esbozo de lo que pudiera perfilarse como una metodolog&iacute;a a la hora de abordar problemas de esta naturaleza.Aspectos como la correcta tipificaci&oacute;n de los datos y sus dominios, contar con un conjunto de reglas y t&eacute;cnicas que permitan la correcci&oacute;n, homologaci&oacute;n y eliminaci&oacute;n de valores err&oacute;neos, as&iacute; como criterios de evaluaci&oacute;n acerca de la bondad de las mismas son parte de lo que queremos proponer como marco de trabajo.Los datos a analizar son el resultado de un proceso llevado a cabo en el contexto de un proyecto de migraci&oacute;n de base de datos de una empresa de servicios el&eacute;ctricos.Se definen e implementan las mediciones de calidad a realizar sobre la base de datos, y se establece la forma de registrar los resultados de las mismas. Luego se definen e implementan procesos de limpieza -autom&aacute;ticos y semiautom&aacute;ticos- con el fin de corregir los errores detectados. Para las implementaciones se utilizan sentencias SQL, obteniendo como resultado un Script que automatiza el ciclo completo de la calidad de datos: medici&oacute;n, registro y limpieza necesaria para llevar a cabo la migraci&oacute;n de la base de datos</p>
Resumen dc.description <p>This project report describes the implementation of a methodological framework for the development of data quality projects. While a quality project data is full of casuistry and special process that make it very difficult to conceive of any kind of generalization, we wanted to capture in the development of this paper an outline of what might emerge as a methodology when addressing problems of this nature. Aspects such as the correct classification of the data and their domains, have a set of rules and techniques to enable correction, approval and removal of erroneous values and evaluation criteria of the goodness of these are part of what we want propose as a framework. The data analyzed are the result of a process carried out in the context of a migration project database of electric utility.They are defined and implemented quality measurements to be performed on the database, and how to record the results of the same set. Then they define and implement cleaning processes -automatic and semiautomatic- in order to correct the errors found.For implementations SQL statements are used, resulting in a script that automates the full cycle of data quality: measurement, registration and cleaning required to perform the migration of the database</p>
Formato dc.format PDF
Lenguaje dc.language spa
dc.rights autorizado
dc.source http://opac.pucv.cl/pucv_txt/txt-7500/UCE7830_01.pdf
Materia dc.subject Bases de datos
Materia dc.subject Gestión de la información
Materia dc.subject Data mining
Title dc.title Data quality para la migración de una base de datos orientada a columnas
Tipo dc.type texto


Archivos en el ítem

Archivos Tamaño Formato Ver

No hay archivos asociados a este ítem.

Este ítem aparece en la(s) siguiente(s) colección(ones)

Mostrar el registro sencillo del ítem