<p>Bajo el contexto de que existen diversos problemas para detectar errores gramaticales relacionados con diversos aspectos del lenguaje inglés y a la vez asumiendo la existencia de herramientas para realizar procesamiento del lenguaje natural, podemos suponer que la utilización de dichas herramientas nos podría ayudar a resolver muchos de esos problemas. Es por esto que una de las principales temáticas de este trabajo es desarrollar ideas tanto innovadoras como ya existentes, en las cuales serán utilizadas dichas herramientas con el fin de solventar problemáticas de carácter complejo o simple. En cuanto al desarrollo del contenido, en una primera instancia se busca aclarar el contexto tanto del problema principal como sus posibles soluciones, abordando diversos conceptos claves como Machine Learning, Deep learning, procesamiento del lenguaje natural -NLP-, errores semánticos, etc. Para luego relacionar las diversas herramientas disponibles en el mercado, en donde algunas de estas herramientas son las bibliotecas de Python como -Part of Speech- -POS- o simplemente plataformas web, cabe mencionar que la mayoría de ellas se pueden encontrar con libre acceso para la comunidad. Por otro lado, también se da un espacio para proponer ideas poco convencionales para el procesamiento de texto, tales como conversión de texto a ondas o series de datos, pero siempre enmarcado en un contexto de carácter explicativo-teórico. En último lugar se presenta un modelo que intenta abordar la predicción de un punto utilizando tecnología referente a modelos de clasificación, tales como SGDClassifier, SVM, GaussianNB y logistic Regression -9-. Adicionalmente, para buscar una mayor exactitud en dichos modelos y obtener una variabilidad más amplia de resultados se utiliza el método de descarte de características RFE con diversos estimadores. Finalmente, para concluir el trabajo se dan a conocer algunos aspectos importantes a considerar para la utilización de las herramientas antes descritas, también se dan a conocer los resultados de los experimentos realizados en base al modelo propuesto, en donde dichos resultados son comparados bajo 4 métricas acordes a problemas de clasificación</p>
<p>Under the context that there are various problems to detect grammatical errors related to various aspects of the English language and at the same time assuming the existence of tools to perform natural language processing, we can assume that the use of these tools could help us solve many of those problems. That is why one of the main themes of this work is to develop both innovative and existing ideas, in which these tools will be used in order to solve complex or simple problems. Regarding the development of the content, in the first instance it seeks to clarify the context of both the main problem and its possible solutions, addressing various key concepts such as Machine Learning, Deep Learning, natural language processing -NLP-, semantic errors, etc. To then relate the various tools available in the market, where some of these tools are Python libraries such as Part of Speech -POS- or simply web platforms, it should be mentioned that most of them can be found with free access to community. On the other hand, there is also a space to propose unconventional ideas for the text processing, such as the text conversion to waves or series of data, but always framed in a context of theoretical explanatory nature. Finally, we present a model that tries to approach the prediction of a point using technology related to classification models, such as SGDClassifier, SVM, GaussianNB and logistic Regression -9-. Additionally, to seek greater accuracy in these models and obtain a wider variability of results, the discard method of RFE characteristics with various estimators is used. Finally, to conclude the work, some important aspects to be considered for the use of the tools described above are disclosed, the results of the experiments carried out based on the proposed model are also disclosed, where said results are compared under 4 metrics according to classification problems</p>
last modification
Licenciado en Ciencias de la Ingeniería
Ingeniero Civil en Informáticatítulo
INGENIERIA CIVIL INFORMATICA
<p>Bajo el contexto de que existen diversos problemas para detectar errores gramaticales relacionados con diversos aspectos del lenguaje inglés y a la vez asumiendo la existencia de herramientas para realizar procesamiento del lenguaje natural, podemos suponer que la utilización de dichas herramientas nos podría ayudar a resolver muchos de esos problemas. Es por esto que una de las principales temáticas de este trabajo es desarrollar ideas tanto innovadoras como ya existentes, en las cuales serán utilizadas dichas herramientas con el fin de solventar problemáticas de carácter complejo o simple. En cuanto al desarrollo del contenido, en una primera instancia se busca aclarar el contexto tanto del problema principal como sus posibles soluciones, abordando diversos conceptos claves como Machine Learning, Deep learning, procesamiento del lenguaje natural -NLP-, errores semánticos, etc. Para luego relacionar las diversas herramientas disponibles en el mercado, en donde algunas de estas herramientas son las bibliotecas de Python como -Part of Speech- -POS- o simplemente plataformas web, cabe mencionar que la mayoría de ellas se pueden encontrar con libre acceso para la comunidad. Por otro lado, también se da un espacio para proponer ideas poco convencionales para el procesamiento de texto, tales como conversión de texto a ondas o series de datos, pero siempre enmarcado en un contexto de carácter explicativo-teórico. En último lugar se presenta un modelo que intenta abordar la predicción de un punto utilizando tecnología referente a modelos de clasificación, tales como SGDClassifier, SVM, GaussianNB y logistic Regression -9-. Adicionalmente, para buscar una mayor exactitud en dichos modelos y obtener una variabilidad más amplia de resultados se utiliza el método de descarte de características RFE con diversos estimadores. Finalmente, para concluir el trabajo se dan a conocer algunos aspectos importantes a considerar para la utilización de las herramientas antes descritas, también se dan a conocer los resultados de los experimentos realizados en base al modelo propuesto, en donde dichos resultados son comparados bajo 4 métricas acordes a problemas de clasificación</p>
<p>Under the context that there are various problems to detect grammatical errors related to various aspects of the English language and at the same time assuming the existence of tools to perform natural language processing, we can assume that the use of these tools could help us solve many of those problems. That is why one of the main themes of this work is to develop both innovative and existing ideas, in which these tools will be used in order to solve complex or simple problems. Regarding the development of the content, in the first instance it seeks to clarify the context of both the main problem and its possible solutions, addressing various key concepts such as Machine Learning, Deep Learning, natural language processing -NLP-, semantic errors, etc. To then relate the various tools available in the market, where some of these tools are Python libraries such as Part of Speech -POS- or simply web platforms, it should be mentioned that most of them can be found with free access to community. On the other hand, there is also a space to propose unconventional ideas for the text processing, such as the text conversion to waves or series of data, but always framed in a context of theoretical explanatory nature. Finally, we present a model that tries to approach the prediction of a point using technology related to classification models, such as SGDClassifier, SVM, GaussianNB and logistic Regression -9-. Additionally, to seek greater accuracy in these models and obtain a wider variability of results, the discard method of RFE characteristics with various estimators is used. Finally, to conclude the work, some important aspects to be considered for the use of the tools described above are disclosed, the results of the experiments carried out based on the proposed model are also disclosed, where said results are compared under 4 metrics according to classification problems</p>