<p>Muchas instituciones manejan enormes cantidades de información que circula por sus redes como paquetes de datos, que son vulnerables frente a ataques informáticos de diversa índole. Una opción para mitigar el riesgo de estos ataques es usar sistemas de detección de intrusiones (IDS), los que monitorean las redes constantemente en busca de anomalías. Sin embargo, los ataques son diversos y cambiantes, en consecuencia siempre existirá la necesidad de mejorar los procesos de clasificación.</p><p>En este contexto, el objetivo del presente proyecto de título es desarrollar e implementar la técnica LS-SVM con PSO para la detección de intrusiones. Para llevar a cabo la construcción y evaluación de cada modelo de clasificación, cada proceso es dividido en dos etapas: entrenamiento y pruebas. En la primera, el algoritmo de clasificación es optimizado por PSO, de tal manera, que una vez construido el modelo, cuente con la capacidad de responder bien frente a cualquier dato, incluyendo los desconocidos. En la segunda etapa, se realizan pruebas para medir la bondad del modelo en base a una serie de índices. Un punto fundamental en este desarrollo fue que los conjuntos de datos, de las dos etapas, tuvieran la menor cantidad de datos en común. De esta manera se pudo evaluar efectivamente la capacidad de generalización de cada modelo.</p><p>Los resultados obtenidos por el mejor modelo indican que se alcanzó un 83,49% de exactitud promedio, del cual, al rededor de un 6% fue aportado por PSO. Este aporte podría parecer algo insustancial, sin embargo, se debe considerar que entre mayor sea el desempeño del clasificador por si solo (sin optimización), menores serán las mejoras que hacer. Además, se debe considerar que los modelos se entrenaron con 2.000 datos, para, posteriormente, ser puestos a prueba contra 22.544 en la fase de pruebas.</p><p>Es posible afirmar que LS-SVM es una excelente técnica para clasificación, que además, demostró un alto poder de generalización, ya que demostró un gran desempeño tras clasificar más de 20.000 datos absolutamente desconocidos. Respecto a PSO, se pudo comprobar las ventajas de su uso, puesto que aumentó la efectividad de LS-SVM en relación al problema de IDS</p>
<p>Many institutions handle huge amounts of information that flows through their networks as data packets, which are vulnerable to attacks from various kinds. One option to mitigate the risk of these attacks is to use intrusion detection systems (IDS), which constantly monitor the network for anomalies. However, the attacks are varied and changing, therefore there will always be the need to improve the classification processes.</p><p>In this context, the objective of this project is to develop and implement LS-SVM technique with PSO for intrusion detection. To carry out the construction and evaluation of each classification model, each process is divided into two stages: training and testing. In the first, the classification algorithm is optimized by PSO, so that once built the model, has the ability to respond well against any data, including unknown. In the second stage, tests are done to measure the accuracy of the model based on a number of rates. A key point in this development was that the data sets of the two stages, had the least amount of data in common. In this way it could effectively evaluate the generalization ability of the models.</p><p>The results obtained indicate that the best model was reached on 83.49% average accuracy, which, around 6% was contributed by PSO. This contribution might seem somewhat small, however, consider that the higher the performance of the classifier by itself (without optimization), the smaller the improvements to do. Also, consider that training processes were used about 2.000 data, to then be tested against 22.544 in the testing phase.</p><p>Arguably, LS-SVM is an excellent technique for classification, which also showed a high power of generalization, because it showed a great performance after classify more than 20.000 absolutly unknown data. Regarding PSO, it was observed the advantages of its use, because it could increase the effectiveness of LS-SVM in relation to the IDS problem</p>
last modification
Licenciado en Ciencias de la Ingeniería
Ingeniero Civil en Informáticatítulo
INGENIERIA CIVIL INFORMATICA
<p>Muchas instituciones manejan enormes cantidades de información que circula por sus redes como paquetes de datos, que son vulnerables frente a ataques informáticos de diversa índole. Una opción para mitigar el riesgo de estos ataques es usar sistemas de detección de intrusiones (IDS), los que monitorean las redes constantemente en busca de anomalías. Sin embargo, los ataques son diversos y cambiantes, en consecuencia siempre existirá la necesidad de mejorar los procesos de clasificación.</p><p>En este contexto, el objetivo del presente proyecto de título es desarrollar e implementar la técnica LS-SVM con PSO para la detección de intrusiones. Para llevar a cabo la construcción y evaluación de cada modelo de clasificación, cada proceso es dividido en dos etapas: entrenamiento y pruebas. En la primera, el algoritmo de clasificación es optimizado por PSO, de tal manera, que una vez construido el modelo, cuente con la capacidad de responder bien frente a cualquier dato, incluyendo los desconocidos. En la segunda etapa, se realizan pruebas para medir la bondad del modelo en base a una serie de índices. Un punto fundamental en este desarrollo fue que los conjuntos de datos, de las dos etapas, tuvieran la menor cantidad de datos en común. De esta manera se pudo evaluar efectivamente la capacidad de generalización de cada modelo.</p><p>Los resultados obtenidos por el mejor modelo indican que se alcanzó un 83,49% de exactitud promedio, del cual, al rededor de un 6% fue aportado por PSO. Este aporte podría parecer algo insustancial, sin embargo, se debe considerar que entre mayor sea el desempeño del clasificador por si solo (sin optimización), menores serán las mejoras que hacer. Además, se debe considerar que los modelos se entrenaron con 2.000 datos, para, posteriormente, ser puestos a prueba contra 22.544 en la fase de pruebas.</p><p>Es posible afirmar que LS-SVM es una excelente técnica para clasificación, que además, demostró un alto poder de generalización, ya que demostró un gran desempeño tras clasificar más de 20.000 datos absolutamente desconocidos. Respecto a PSO, se pudo comprobar las ventajas de su uso, puesto que aumentó la efectividad de LS-SVM en relación al problema de IDS</p>
<p>Many institutions handle huge amounts of information that flows through their networks as data packets, which are vulnerable to attacks from various kinds. One option to mitigate the risk of these attacks is to use intrusion detection systems (IDS), which constantly monitor the network for anomalies. However, the attacks are varied and changing, therefore there will always be the need to improve the classification processes.</p><p>In this context, the objective of this project is to develop and implement LS-SVM technique with PSO for intrusion detection. To carry out the construction and evaluation of each classification model, each process is divided into two stages: training and testing. In the first, the classification algorithm is optimized by PSO, so that once built the model, has the ability to respond well against any data, including unknown. In the second stage, tests are done to measure the accuracy of the model based on a number of rates. A key point in this development was that the data sets of the two stages, had the least amount of data in common. In this way it could effectively evaluate the generalization ability of the models.</p><p>The results obtained indicate that the best model was reached on 83.49% average accuracy, which, around 6% was contributed by PSO. This contribution might seem somewhat small, however, consider that the higher the performance of the classifier by itself (without optimization), the smaller the improvements to do. Also, consider that training processes were used about 2.000 data, to then be tested against 22.544 in the testing phase.</p><p>Arguably, LS-SVM is an excellent technique for classification, which also showed a high power of generalization, because it showed a great performance after classify more than 20.000 absolutly unknown data. Regarding PSO, it was observed the advantages of its use, because it could increase the effectiveness of LS-SVM in relation to the IDS problem</p>