Brasil
Brasil
Este trabalho propõe uma aplicação web que usa um modelo de caixa preta Support Vector Machine (SVM) com 79% de acurácia para classificar o sentimento de tweets sobre a COVID-19 integrando o framework LIME de forma interativa para explicar decisões sobre previsões. Além do ganho de transparência em relação à avaliação de amostras falso-positivas, notou-se também que o modelo SVM tende a falhar ao associar um teste positivo de COVID-19 a um bom sentimento e se confunde em previso˜es envolvendo palavras sobre a COVID-19, como Omicron, que indica falta de representatividade na base de dados. Além disso, a partir dos resultados do LIME, foi possível melhorar a acura´cia do modelo para 81% ao incluir as stopwords ”not” e ”no”.
The present work proposes a web application that uses an Support Vector Machine (SVM) black box model with 79% accuracy to classify sentiment from tweets about COVID-19 integrating the LIME framework in an interactive way to explain decisions about predictions. Besides the gain in transparency in relation to the evaluation of false positive samples, it was also noted that the SVM model tends to fail when associating a positive COVID-19 test with a good sentiment and gets confused in specific predictions involving words related to COVID-19 variants such as Omicron, which indicate lack of representativeness in the database. In addition, from the LIME results, it was possible to improve the model accuracy to 81% by including the stopwords “not” and “no”.