Loja, Ecuador
En el presente trabajo tiene como objetivo analizar y clasificar por medio de técnicas de aprendizaje automático el texto los mensajes enviados a través del Entorno Virtual de Aprendizaje (EVA) de la Universidad Técnica Particular de Loja con la finalidad de conocer el nivel de positivismo o negativismo de los estudiantes.
Se identifica y aplica distintos métodos de minería de texto para calcular la polaridad de los mensajes. El proceso tiene diversas fases qué parten luego de la obtención de información del EVA, se procede a almacenar los mensajes en un repositorio para iniciar con la limpieza de datos, en la cual se eliminan todos aquellos caracteres que no aporten en el análisis y dejarlos en un formato establecido. Se ejecuta el “Análisis de Sentimientos” para ello utilizaron diferentes métodos de clasificación:
R utilizando Tidy, en java el framework stanford.nlp, con Python se ejecutaron los métodos: Naive Bayes, máquina de vectores soporte y el paquete Textblob. En el resultado consolidado se observó que existió un 84.14% mensajes positivos, un 12.32% negativos y finalmente con el 3.54% de mensajes neutros.
This project pretends to analyze and classify the messages sent through the Virtual Learning Environment (EVA) of the Technical University of Loja. The aim of it is to know the level of positivism or negativism on students through automatic learning techniques. Different text mining methods are identified and applied to calculate the polarity of messages. The process has several phases.
First, it starts by obtaining information from EVA. Then, the messages are stored and analysed in a repository, the data which does not contribute is eliminated and left in an established format. The “Sentiment Analysis” is executed for this;
it uses different classification methods: R using Tidy, in java the stanford.nlp framework, with Python the methods were executed: Naive Bayes, support vector machine and the Textblob package. In the consolidated result, it was observed that there were 84.14% positive messages, 12.32% negative and finally with 3.54% of neutral messages.