La cantidad de datos en el mundo está aumentando a una tasa de 40-50 por ciento anual, este enorme aumento y los diversos tipos de datos que existen en la actualidad, hacen dudar de las capacidades de las bases de datos relacionales. La industria del agua utiliza una inmensa cantidad de datos, se cree que este tipo de compañías se podrían beneficiar bastante de análisis predictivos y de diagnóstico en tiempo real, permitiendo una mejora en su toma de decisiones. En esta tesis, se utilizará Data Mining para mejorar el sistema de detección de consumos fraudulentos en la compañía ESVAL, comparando tres de las técnicas más utilizadas en el área de clasificación: Redes Neuronales Artificiales -ANN-, Máquina de vector de soporte -SVM- y K Vecinos Más cercanos -KNN-
Tesis
La cantidad de datos en el mundo está aumentando a una tasa de 40-50 por ciento anual, este enorme aumento y los diversos tipos de datos que existen en la actualidad, hacen dudar de las capacidades de las bases de datos relacionales. La industria del agua utiliza una inmensa cantidad de datos, se cree que este tipo de compañías se podrían beneficiar bastante de análisis predictivos y de diagnóstico en tiempo real, permitiendo una mejora en su toma de decisiones. En esta tesis, se utilizará Data Mining para mejorar el sistema de detección de consumos fraudulentos en la compañía ESVAL, comparando tres de las técnicas más utilizadas en el área de clasificación: Redes Neuronales Artificiales -ANN-, Máquina de vector de soporte -SVM- y K Vecinos Más cercanos -KNN-
Ingeniería Civil Informática