La presente tesis realiza el análisis y evaluación del desempeño que entrega la clasificación automática de texto utilizando los algoritmos K-NN y K-Means al ser aplicado a la minería de opinión. Estos algoritmos se utilizaron bajo diversos contextos lingüísticos (Lematización, Bi-gramas, Trigramas). A diferencia de estudios similares, se incorporó; la ponderación TF-IDF y la TF-RFL como un medio de optimizar resultados esperados. Los algoritmos fueron implementados y comparados para mostrar la relación y diferencia entre ellos al ser aplicados a un conjunto de Tweets, los cuales cuentan con las opiniones generadas por los usuarios de la plataforma Twitter en relación a una empresa de marketing, Falabella
Tesis
La presente tesis realiza el análisis y evaluación del desempeño que entrega la clasificación automática de texto utilizando los algoritmos K-NN y K-Means al ser aplicado a la minería de opinión. Estos algoritmos se utilizaron bajo diversos contextos lingüísticos (Lematización, Bi-gramas, Trigramas). A diferencia de estudios similares, se incorporó; la ponderación TF-IDF y la TF-RFL como un medio de optimizar resultados esperados. Los algoritmos fueron implementados y comparados para mostrar la relación y diferencia entre ellos al ser aplicados a un conjunto de Tweets, los cuales cuentan con las opiniones generadas por los usuarios de la plataforma Twitter en relación a una empresa de marketing, Falabella
Ingeniería Civil Informática