<p>En la actualidad para el análisis de grandes cantidades de datos son cada vez más utilizados los algoritmos de aprendizaje automático. Los algoritmos de aprendizaje automático generalmente reciben una tabla de base de datos de entrada, pero hoy en día las bases de datos vienen distribuidas en múltiples tablas lo que implica realizar múltiples JOIN del tipo Clave Primaria - Clave Foránea, y esto resulta costoso a nivel de tiempo. En este trabajo se demuestra que es posible que algunos de estos JOINS son posibles de evitar sin afectar el rendimiento del algoritmo de aprendizaje automático. Para lograr esto se analizan una serie de reglas de decisión y su efecto en ciertos conjuntos de datos. Finalmente se muestran resultados experimentales, donde es posible observar que en base a las reglas de decisión si es posible evitar JOINS de manera segura, es decir sin afectar el rendimiento del algoritmo de aprendizaje automático</p>
<p>Nowadays for the analysis of large quantities of data the Machine Learning algorithms are becoming more and more used. The Machine Learning algorithms generally recieve one single data table as input, but on these days the data bases are distribuited in multiples tables which it involves to perform many key-foreign key JOINS, and this results costly in time. In this work it proves that is possible to avoid some of these JOINS without affecting the performance of the Machine Learning algorithms. To achieve these, a series of decision rules and their effect on some datasets are analized. Finally experimental results are shown, where its possible to observe that these decision rules works for avoiding JOINS safely, in other words without affecting the performance of the Machine Learning algorithms</p>
last modification
Ingeniero Civil en Informática
INGENIERIA CIVIL INFORMATICA
<p>En la actualidad para el análisis de grandes cantidades de datos son cada vez más utilizados los algoritmos de aprendizaje automático. Los algoritmos de aprendizaje automático generalmente reciben una tabla de base de datos de entrada, pero hoy en día las bases de datos vienen distribuidas en múltiples tablas lo que implica realizar múltiples JOIN del tipo Clave Primaria - Clave Foránea, y esto resulta costoso a nivel de tiempo. En este trabajo se demuestra que es posible que algunos de estos JOINS son posibles de evitar sin afectar el rendimiento del algoritmo de aprendizaje automático. Para lograr esto se analizan una serie de reglas de decisión y su efecto en ciertos conjuntos de datos. Finalmente se muestran resultados experimentales, donde es posible observar que en base a las reglas de decisión si es posible evitar JOINS de manera segura, es decir sin afectar el rendimiento del algoritmo de aprendizaje automático</p>
<p>Nowadays for the analysis of large quantities of data the Machine Learning algorithms are becoming more and more used. The Machine Learning algorithms generally recieve one single data table as input, but on these days the data bases are distribuited in multiples tables which it involves to perform many key-foreign key JOINS, and this results costly in time. In this work it proves that is possible to avoid some of these JOINS without affecting the performance of the Machine Learning algorithms. To achieve these, a series of decision rules and their effect on some datasets are analized. Finally experimental results are shown, where its possible to observe that these decision rules works for avoiding JOINS safely, in other words without affecting the performance of the Machine Learning algorithms</p>