<p>En el presente informe se presenta el marco general del proyecto, el marco teórico y la aplicación de Web Usage Mining en el estudio del comportamiento de los usuarios en el Sistema de Biblioteca PUCV. Para realizar este tipo de estudios es necesario conocer la forma de gestionar el conocimiento en la web y a partir de esto evaluar las técnicas y herramientas que sirven para apoyar este tipo de estudios y así generar conocimientos a partir de información que se encuentre disponible. En este caso especifico de estudio, se utilizó la información contenida en los logs del servidor donde se encuentra alojado el Sistema de Biblioteca, y se utilizó un Data Warehouse con esquema tipo estrella para mantener la información contenida en ellos de forma estructurada y así facilitar el análisis sobre estos datos mediante la generación de cubos OLAP. A partir del proceso ETL que se llevó a cabo, se logró generar estadísticas generales sobre los accesos al sitio durante el periodo de tiempo considerado en el estudio y posteriormente, se realizó un análisis sobre las sesiones de los usuarios y secuencias de clickstreams en donde se pudo obtener resultados interesantes sobre el comportamiento de los usuarios en el sistema. Así, se pudo generar por ejemplo, puntos comunes de salida, duraciones de navegación, cantidad de páginas visitadas por los usuarios, etc. características que son de gran relevancia para las personas encargadas de administrar el sitio. Luego, se utilizó el algoritmo A priori, el cual genera reglas de asociación basadas en una medida de soporte y confianza que permitió observar como acceden los usuarios a las distintas secciones y así establecer posibles formas de reestructuraciones al sistema. Finalmente, se validaron los resultados obtenidos con las personas encargadas y se pudo comprobar que el objetivo principal del sistema se cumple en gran medida</p>
<p>This work presents the general context of the project, the theoretical framework and the application of Web Usage Mining in the study of user behavior in PUCV Library System. To perform this kind of study is basic to understand how is managed the knowledge on the web and then evaluate the techniques and tools used to support this kind of study and generate knowledge from the available information. In this specific case of study was used the information contained in the logs‟ server where is hosted the Library System and, to store the logs information a Data Warehouse with star scheme was used to keep the information structured and thus facilitate the analysis using OLAP Cubes. From the ETL process was performed was possible to generate general statistics about access to the site during the time period considered in the study and subsequently carried out an analysis of user sessions and clickstreams sequences where it could obtain interesting results about user behaviors on the system. Thus, it could be generated for example, common points of departure, navigation durations, number of viewed pages by users, etc. characteristics that are highly relevant to people responsible for managing the site. Then was used the A priori algorithm, which generates association rules based on a measure of support and confidence, that allow to see how users access to various sections and then establish possible ways of restructuring the system. Finally, the results was validated with people in charge of manage the Library System and it was found that the main objective of the system is largely achieved</p>
last modification
Licenciado en Ciencias de la Ingeniería
Ingeniero Civil en Informáticatítulo
INGENIERIA CIVIL INFORMATICA
<p>En el presente informe se presenta el marco general del proyecto, el marco teórico y la aplicación de Web Usage Mining en el estudio del comportamiento de los usuarios en el Sistema de Biblioteca PUCV. Para realizar este tipo de estudios es necesario conocer la forma de gestionar el conocimiento en la web y a partir de esto evaluar las técnicas y herramientas que sirven para apoyar este tipo de estudios y así generar conocimientos a partir de información que se encuentre disponible. En este caso especifico de estudio, se utilizó la información contenida en los logs del servidor donde se encuentra alojado el Sistema de Biblioteca, y se utilizó un Data Warehouse con esquema tipo estrella para mantener la información contenida en ellos de forma estructurada y así facilitar el análisis sobre estos datos mediante la generación de cubos OLAP. A partir del proceso ETL que se llevó a cabo, se logró generar estadísticas generales sobre los accesos al sitio durante el periodo de tiempo considerado en el estudio y posteriormente, se realizó un análisis sobre las sesiones de los usuarios y secuencias de clickstreams en donde se pudo obtener resultados interesantes sobre el comportamiento de los usuarios en el sistema. Así, se pudo generar por ejemplo, puntos comunes de salida, duraciones de navegación, cantidad de páginas visitadas por los usuarios, etc. características que son de gran relevancia para las personas encargadas de administrar el sitio. Luego, se utilizó el algoritmo A priori, el cual genera reglas de asociación basadas en una medida de soporte y confianza que permitió observar como acceden los usuarios a las distintas secciones y así establecer posibles formas de reestructuraciones al sistema. Finalmente, se validaron los resultados obtenidos con las personas encargadas y se pudo comprobar que el objetivo principal del sistema se cumple en gran medida</p>
<p>This work presents the general context of the project, the theoretical framework and the application of Web Usage Mining in the study of user behavior in PUCV Library System. To perform this kind of study is basic to understand how is managed the knowledge on the web and then evaluate the techniques and tools used to support this kind of study and generate knowledge from the available information. In this specific case of study was used the information contained in the logs‟ server where is hosted the Library System and, to store the logs information a Data Warehouse with star scheme was used to keep the information structured and thus facilitate the analysis using OLAP Cubes. From the ETL process was performed was possible to generate general statistics about access to the site during the time period considered in the study and subsequently carried out an analysis of user sessions and clickstreams sequences where it could obtain interesting results about user behaviors on the system. Thus, it could be generated for example, common points of departure, navigation durations, number of viewed pages by users, etc. characteristics that are highly relevant to people responsible for managing the site. Then was used the A priori algorithm, which generates association rules based on a measure of support and confidence, that allow to see how users access to various sections and then establish possible ways of restructuring the system. Finally, the results was validated with people in charge of manage the Library System and it was found that the main objective of the system is largely achieved</p>