Bibliotecas PUCV

Detección y corrección de errores basados en reglas gramaticales del inglés en conjunto con el mejoramiento de estilos de escritura, aplicado en artículos científicos mediante algoritmos de Procesamiento de Lenguaje Natural -NLP-

Repositorio Dspace/Manakin

Buscar en DSpace


Búsqueda avanzada

Mostrar el registro sencillo del ítem

dc.contributor Allende Cid, Héctor Gabriel
dc.creator Montiel Montiel, Jorge Patricio
Fecha Ingreso dc.date.accessioned 2021-10-21T13:27:11Z
Fecha Disponible dc.date.available 2021-10-21T13:27:11Z
Fecha en Repositorio dc.date.issued 2021-10-21
Resumen dc.description <p>Bajo el contexto de que existen diversos problemas para detectar errores gramaticales relacionados con diversos aspectos del lenguaje ingl&eacute;s y a la vez asumiendo la existencia de herramientas para realizar procesamiento del lenguaje natural, podemos suponer que la utilizaci&oacute;n de dichas herramientas nos podr&iacute;a ayudar a resolver muchos de esos problemas. Es por esto que una de las principales tem&aacute;ticas de este trabajo es desarrollar ideas tanto innovadoras como ya existentes, en las cuales ser&aacute;n utilizadas dichas herramientas con el fin de solventar problem&aacute;ticas de car&aacute;cter complejo o simple. En cuanto al desarrollo del contenido, en una primera instancia se busca aclarar el contexto tanto del problema principal como sus posibles soluciones, abordando diversos conceptos claves como Machine Learning, Deep learning, procesamiento del lenguaje natural -NLP-, errores sem&aacute;nticos, etc. Para luego relacionar las diversas herramientas disponibles en el mercado, en donde algunas de estas herramientas son las bibliotecas de Python como -Part of Speech- -POS- o simplemente plataformas web, cabe mencionar que la mayor&iacute;a de ellas se pueden encontrar con libre acceso para la comunidad. Por otro lado, tambi&eacute;n se da un espacio para proponer ideas poco convencionales para el procesamiento de texto, tales como conversi&oacute;n de texto a ondas o series de datos, pero siempre enmarcado en un contexto de car&aacute;cter explicativo-te&oacute;rico. En &uacute;ltimo lugar se presenta un modelo que intenta abordar la predicci&oacute;n de un punto utilizando tecnolog&iacute;a referente a modelos de clasificaci&oacute;n, tales como SGDClassifier, SVM, GaussianNB y logistic Regression -9-. Adicionalmente, para buscar una mayor exactitud en dichos modelos y obtener una variabilidad m&aacute;s amplia de resultados se utiliza el m&eacute;todo de descarte de caracter&iacute;sticas RFE con diversos estimadores. Finalmente, para concluir el trabajo se dan a conocer algunos aspectos importantes a considerar para la utilizaci&oacute;n de las herramientas antes descritas, tambi&eacute;n se dan a conocer los resultados de los experimentos realizados en base al modelo propuesto, en donde dichos resultados son comparados bajo 4 m&eacute;tricas acordes a problemas de clasificaci&oacute;n</p>
Resumen dc.description <p>Under the context that there are various problems to detect grammatical errors related to various aspects of the English language and at the same time assuming the existence of tools to perform natural language processing, we can assume that the use of these tools could help us solve many of those problems. That is why one of the main themes of this work is to develop both innovative and existing ideas, in which these tools will be used in order to solve complex or simple problems. Regarding the development of the content, in the first instance it seeks to clarify the context of both the main problem and its possible solutions, addressing various key concepts such as Machine Learning, Deep Learning, natural language processing -NLP-, semantic errors, etc. To then relate the various tools available in the market, where some of these tools are Python libraries such as Part of Speech -POS- or simply web platforms, it should be mentioned that most of them can be found with free access to community. On the other hand, there is also a space to propose unconventional ideas for the text processing, such as the text conversion to waves or series of data, but always framed in a context of theoretical explanatory nature. Finally, we present a model that tries to approach the prediction of a point using technology related to classification models, such as SGDClassifier, SVM, GaussianNB and logistic Regression -9-. Additionally, to seek greater accuracy in these models and obtain a wider variability of results, the discard method of RFE characteristics with various estimators is used. Finally, to conclude the work, some important aspects to be considered for the use of the tools described above are disclosed, the results of the experiments carried out based on the proposed model are also disclosed, where said results are compared under 4 metrics according to classification problems</p>
Resumen dc.description last modification
Resumen dc.description Licenciado en Ciencias de la Ingeniería
Resumen dc.description Ingeniero Civil en Informáticatítulo
Resumen dc.description INGENIERIA CIVIL INFORMATICA
Resumen dc.description <p>Bajo el contexto de que existen diversos problemas para detectar errores gramaticales relacionados con diversos aspectos del lenguaje ingl&eacute;s y a la vez asumiendo la existencia de herramientas para realizar procesamiento del lenguaje natural, podemos suponer que la utilizaci&oacute;n de dichas herramientas nos podr&iacute;a ayudar a resolver muchos de esos problemas. Es por esto que una de las principales tem&aacute;ticas de este trabajo es desarrollar ideas tanto innovadoras como ya existentes, en las cuales ser&aacute;n utilizadas dichas herramientas con el fin de solventar problem&aacute;ticas de car&aacute;cter complejo o simple. En cuanto al desarrollo del contenido, en una primera instancia se busca aclarar el contexto tanto del problema principal como sus posibles soluciones, abordando diversos conceptos claves como Machine Learning, Deep learning, procesamiento del lenguaje natural -NLP-, errores sem&aacute;nticos, etc. Para luego relacionar las diversas herramientas disponibles en el mercado, en donde algunas de estas herramientas son las bibliotecas de Python como -Part of Speech- -POS- o simplemente plataformas web, cabe mencionar que la mayor&iacute;a de ellas se pueden encontrar con libre acceso para la comunidad. Por otro lado, tambi&eacute;n se da un espacio para proponer ideas poco convencionales para el procesamiento de texto, tales como conversi&oacute;n de texto a ondas o series de datos, pero siempre enmarcado en un contexto de car&aacute;cter explicativo-te&oacute;rico. En &uacute;ltimo lugar se presenta un modelo que intenta abordar la predicci&oacute;n de un punto utilizando tecnolog&iacute;a referente a modelos de clasificaci&oacute;n, tales como SGDClassifier, SVM, GaussianNB y logistic Regression -9-. Adicionalmente, para buscar una mayor exactitud en dichos modelos y obtener una variabilidad m&aacute;s amplia de resultados se utiliza el m&eacute;todo de descarte de caracter&iacute;sticas RFE con diversos estimadores. Finalmente, para concluir el trabajo se dan a conocer algunos aspectos importantes a considerar para la utilizaci&oacute;n de las herramientas antes descritas, tambi&eacute;n se dan a conocer los resultados de los experimentos realizados en base al modelo propuesto, en donde dichos resultados son comparados bajo 4 m&eacute;tricas acordes a problemas de clasificaci&oacute;n</p>
Resumen dc.description <p>Under the context that there are various problems to detect grammatical errors related to various aspects of the English language and at the same time assuming the existence of tools to perform natural language processing, we can assume that the use of these tools could help us solve many of those problems. That is why one of the main themes of this work is to develop both innovative and existing ideas, in which these tools will be used in order to solve complex or simple problems. Regarding the development of the content, in the first instance it seeks to clarify the context of both the main problem and its possible solutions, addressing various key concepts such as Machine Learning, Deep Learning, natural language processing -NLP-, semantic errors, etc. To then relate the various tools available in the market, where some of these tools are Python libraries such as Part of Speech -POS- or simply web platforms, it should be mentioned that most of them can be found with free access to community. On the other hand, there is also a space to propose unconventional ideas for the text processing, such as the text conversion to waves or series of data, but always framed in a context of theoretical explanatory nature. Finally, we present a model that tries to approach the prediction of a point using technology related to classification models, such as SGDClassifier, SVM, GaussianNB and logistic Regression -9-. Additionally, to seek greater accuracy in these models and obtain a wider variability of results, the discard method of RFE characteristics with various estimators is used. Finally, to conclude the work, some important aspects to be considered for the use of the tools described above are disclosed, the results of the experiments carried out based on the proposed model are also disclosed, where said results are compared under 4 metrics according to classification problems</p>
Formato dc.format PDF
Formato dc.format JEPG
Lenguaje dc.language spa
dc.rights autorizado
dc.source http://opac.pucv.cl/pucv_txt/txt-8000/UCC8107_01.pdf
dc.source http://opac.pucv.cl/pucv_img/Img-8000/UCC8107_01.jpg
Materia dc.subject LINGUISTICA COMPUTACIONAL
Materia dc.subject Lenguaje natural
Materia dc.subject PROCESAMIENTO DEL LENGUAJE
Materia dc.subject APRENDIZAJE POR MAQUINAS
Title dc.title Detección y corrección de errores basados en reglas gramaticales del inglés en conjunto con el mejoramiento de estilos de escritura, aplicado en artículos científicos mediante algoritmos de Procesamiento de Lenguaje Natural -NLP-
Tipo dc.type texto


Archivos en el ítem

Archivos Tamaño Formato Ver

No hay archivos asociados a este ítem.

Este ítem aparece en la(s) siguiente(s) colección(ones)

Mostrar el registro sencillo del ítem