Patricia Quiroz Palma, Juan Carlos Zambrano Zambrano, Alex Santamaría Philco, Willian Zamora Mero, Jorge Herrera Tapia, Dolores Muñoz, Klever Alfredo Delgado Reyes, Dahiana Valeria Alvia Toala
La emergencia sanitaria por la pandemia de COVID-19 y ha sido necesario que sea tratada con respuesta inmediatas e integradas a todas las organizaciones involucradas para lograr intercambio de datos sobre ésta y futuras pandemias globales de rápida propagación. Este estudio se enfoca en predecir la incidencia del COVID-19 en Ecuador mediante minería de datos de los registros proporcionados por instituciones públicas del estado ecuatoriano con información oficial del COVID-19 en el Ecuador. Se experimentó con modelos de regresión y memoria a largo plazo obteniendo como resultado el modelo óptimo para estimar el número de casos positivos de COVID-19. Para los modelos empleados se hizo uso del error cuadrático como métrica del rendimiento. Del análisis de los datos sobre el COVID-19 en Ecuador el modelo de regresión polinomial predijo la incidencia con un error cuadrático de 0.86. siendo los factores más efectivos la incidencia de días anteriores y el número de población de cada una de las provincias afectadas.
The health emergency due to the COVID-19 pandemic and has been necessary to be treated with immediate and integrated response to all organizations involved in order to achieve data sharing on this and future global pandemics of rapid spread. This study focuses on predicting the incidence of COVID-19 in Ecuador by data mining the records provided by public institutions of the Ecuadorian state with official information on COVID-19 in Ecuador. We experimented with regression and long-term memory models, obtaining as a result the optimal model to estimate the number of positive cases of COVID-19. For the models used, the quadratic error was used as a performance metric. From the analysis of the data on COVID-19 in Ecuador, the polynomial regression model predicted the incidence with a quadratic error of 0.86, the most effective factors being the incidence of previous days and the number of population in each of the affected provinces.