Usando análisis de sentimientos para diferenciar bots y humanos en la difusión de publicaciones científicas sobre COVID-19 en la red social X: un estudio con ChatGPT 3.5 y Gemini 1.5 Flash

Danielle Pompeu Noronha Pontes; João de Melo Maricato

Usando análisis de sentimientos para diferenciar bots y humanos en la difusión de publicaciones científicas sobre COVID-19 en la red social X: un estudio con ChatGPT 3.5 y Gemini 1.5 Flash

Autores: Danielle Pompeu Noronha Pontes, João de Melo Maricato
Localización: Biblios: Revista electrónica de bibliotecología, archivología y museología, ISSN-e 1562-4730, Nº. Extra 89, 2025
Idioma: español
DOI: 10.5195/biblios.2025.1297
Enlaces
- Texto completo (pdf)
Resumen
- Objetivo. Este estudio tiene como objetivo investigar la aplicación del análisis de sentimientos para diferenciar entre cuentas automatizadas (bots) y usuarios humanos en la difusión de publicaciones científicas sobre COVID-19 en la red social X. Para ello, la investigación compara la eficacia de las herramientas de Modelos de Lenguaje de Gran Escala (LLMs), específicamente ChatGPT 3.5 y Gemini 1.5 Flash, en la clasificación de los sentimientos expresados en publicaciones sobre un artículo científico. El estudio busca comprender las diferencias de rendimiento entre estas herramientas, evaluar su eficacia en la clasificación de polaridades y identificar patrones de sentimientos que mejor distingan a los bots de los usuarios humanos en el contexto de la divulgación científica. Método. Este estudio comienza con la recopilación de una muestra de publicaciones en X que mencionaron la publicación analizada. Los posts fueron recolectados utilizando Python 3.12 y la biblioteca Beautiful Soup 4.12 en el entorno de Google Colab, lo que resultó en un conjunto de 9.792 publicaciones y 5.601 perfiles únicos. En una segunda etapa, estos perfiles fueron comparados con un conjunto de datos previamente clasificado como bot o humano. Para mejorar la confiabilidad de la clasificación, posteriormente se realizó una reclasificación manual de 41 cuentas que habían realizado más de cuatro publicaciones (tercera etapa), identificando 20 como bots y 21 como humanas. Estas cuentas generaron un total de 3.493 publicaciones, que fueron sometidas a análisis de sentimientos (cuarta etapa) utilizando las herramientas ChatGPT 3.5 y Gemini 1.5 Flash. La clasificación siguió un prompt estandarizado para categorizar los sentimientos como positivos, negativos o neutros, aplicándose en lotes de 100 publicaciones debido a las limitaciones de tokens de las herramientas. En la quinta etapa, 315 de las publicaciones analizadas fue clasificada manualmente para su validación. Resultados. El análisis de 3.493 publicaciones sobre el artículo científico en X reveló una predominancia de sentimientos negativos (92,3%), con posts neutros (6,2%) y positivos (0,6%), siendo estos últimos menos frecuentes (0,9% no fueron identificados). Las herramientas de inteligencia artificial ChatGPT 3.5 y Gemini 1.5 Flash mostraron desempeños similares al clasificar sentimientos negativos, pero surgieron divergencias en 315 publicaciones, con ChatGPT alcanzando un 85% de precisión en posts que Gemini no logró clasificar. Los bots presentaron una mayor variabilidad emocional y fueron más críticos en relación con la difusión científica, mientras que las publicaciones humanas tendieron a ser más neutras y consistentes, destacando diferencias relevantes para la detección de bots. Conclusiones. El análisis de sentimientos realizado por ChatGPT y Gemini destaca la capacidad de estas herramientas para clasificar publicaciones en redes sociales relacionadas con artículos científicos, revelando patrones distintos entre bots y cuentas humanas. Los bots tienden a generar contenidos más polarizados y predominantemente negativos, mientras que los humanos presentan una mayor diversidad de sentimientos, con un equilibrio entre publicaciones negativas, neutras y algunas positivas. Aunque ChatGPT demostró ser más eficaz en escenarios con pocos datos contextuales o metadatos para evaluar correctamente la polaridad emocional de un texto, el estudio sugiere que es necesaria un análisis más exhaustivo para refinar las herramientas y profundizar en la comprensión de las interacciones entre cuentas humanas y automatizadas.
Referencias bibliográficas
- Anwar, A., & Yaqub, U. (2020). Bot detection in Twitter landscape using unsupervised learning. In The 21st Annual International Conference...
- Arredondo, L. (2018). A study of altmetrics using sentiment analysis. Honors Capstones, 70, 1–6. https://huskiecommons.lib.niu.edu/studentengagement-honorscapstones/70/
- Babur, Z., Bekdemir, U., Sen, A., Carkit, S. O., Genc, O., Gulcu, A., Gumustas, C., & Soyak, E. G. (2023). Unmasking Twitter bots: Feature...
- Bär, D., Calderon, F., Lawlor, M., Licklederer, S., Totzauer, M., & Feuerriegel, S. (2023). Analyzing social media activities at Bellingcat....
- Barreto, S., Moura, R., Carvalho, J., Paes, A., & Plastino, A. (2023). Sentiment analysis in tweets: An assessment study from classical...
- Bello, B. S., & Heckel, R. (2019). Analyzing the behaviour of Twitter bots in post-Brexit politics. In 2019 Sixth International Conference...
- Bello, B. S., Heckel, R., & Minku, L. (2018). Reverse engineering the behaviour of Twitter bots. In 2018 Fifth International Conference...
- Breve, B., Caruccio, L., Cirillo, S., Deufemia, V., & Polese, G. (2024). Analyzing the worldwide perception of the Russia-Ukraine conflict...
- Buscemi, A., & Proverbio, D. (2024). ChatGPT vs Gemini vs LLaMA on multilingual sentiment analysis. arXiv, 1–11. https://doi.org/10.48550/arXiv.2402.01715
- Cai, M., Luo, H., Meng, X., Cui, Y., & Wang, W. (2023). Network distribution and sentiment interaction: Information diffusion mechanisms...
- Çetinkaya, Y. M., Toroslu, İ. H., & Davulcu, H. (2020). Developing a Twitter bot that can join a discussion using state-of-the-art architectures....
- Chawla, V., & Kapoor, Y. (2023). A hybrid framework for bot detection on Twitter: Fusing digital DNA with BERT. Multimedia Tools and Applications,...
- Chen, H., Zhu, Z., Qi, F., Ye, Y., Liu, Z., Sun, M., & Jin, J. (2021). Country image in COVID-19 pandemic: A case study of China. IEEE...
- Darling, E., Shiffman, D., Côté, I., & Drew, J. (2013). The role of Twitter in the life cycle of a scientific publication. Ideas in Ecology...
- Galgoczy, M. C., Phatak, A., Vinson, D., Mago, V. K., & Giabbanelli, P. J. (2022). (Re)shaping online narratives: When bots promote the...
- Gatkal, S., Panjwani, D., Barhate, S., Mangla, R., & Kazi, F. (2021). Community detection and impact of bots on sentiment polarity of...
- Graham, T., Bruns, A., Angus, D., Hurcombe, E., & Hames, S. (2021). #IStandWithDan versus #DictatorDan: The polarised dynamics of Twitter...
- Halevi, G., & Schimming, L. (2018). An initiative to track sentiments in altmetrics. Journal of Altmetrics, 1(1), 1–7. https://doi.org/10.29024/joa.1
- Hassan, S. U., Aljohani, N. R., Tarar, U. I., Safder, I., Sarwar, R., Alelyani, S., & Nawaz, R. (2023). Exploiting tweet sentiments in...
- Hassan, S. U., Saleem, A., Soroya, S. H., Safder, I., Iqbal, S., Jamil, S., Bukhari, F., Aljohani, N. R., & Nawaz, R. (2021). Sentiment...
- Ibrahim, M., Abdillah, O., Wicaksono, A. F., & Adriani, M. (2015). Buzzer detection and sentiment analysis for predicting presidential...
- Inuwa-Dutse, I., Bello, B. S., & Korkontzelos, I. (2018). Lexical analysis of automated accounts on Twitter. In Proceedings of the International...
- Kraaijeveld, O., & De Smedt, J. (2020). The predictive power of public Twitter sentiment for forecasting cryptocurrency prices. Journal...
- Kudugunta, S., & Ferrara, E. (2018). Deep neural networks for bot detection. Information Sciences, 467, 312–322. https://doi.org/10.1016/j.ins.2018.08.019
- Liu, H., Chatterjee, I., Zhou, M., Lu, X. S., & Abusorrah, A. (2020). Aspect-based sentiment analysis: A survey of deep learning methods....
- Liu, X. (2019). A big data approach to examining social bots on Twitter. Journal of Services Marketing, 33(4), 369–379. https://doi.org/10.1108/JSM-02-2018-0049
- Mouronte-López, M. L., Gómez Sánchez-Seco, J., & Benito, R. M. (2024). Patterns of human and bots behaviour on Twitter conversations about...
- Mustafaraj, E., & Metaxas, P. T. (2011). What edited retweets reveal about online political discourse. In Proceedings of the 5th AAAI...
- Pastor-Galindo, J., Zago, M., Nespoli, P., Bernal, S. L., Celdran, A. H., Perez, M. G., Ruiperez-Valiente, J. A., Perez, G. M., & Marmol,...
- Pontes, D., & Maricato, J. (2023a). Dataset with classification of accounts that disclose scientific articles on Twitter between bot,...
- Pontes, D., & Maricato, J. (2023b). Classificação de contas do Twitter através do Botometer. In Encontro Nacional de Pesquisa em Informação...
- Rane, N., Choudhary, S., & Rane, J. (2024). Gemini versus ChatGPT: Applications, performance, architecture, capabilities, and implementation....
- Silva, M. E. M., & Serrano, P. H. S. M. (2023). Análise de sentimentos em textos de redes sociais: Uma comparação entre o ChatGPT e métodos...
- Suarez-Lledo, V., & Alvarez-Galvez, J. (2022). Assessing the role of social bots during the COVID-19 pandemic: Infodemic, disagreement,...
- Tavazoee, F., Buscaldi, D., Mola, F., & Conversano, C. (2020). Empowering detection of malicious social bots and content spammers on Twitter...
- Uyheng, J., & Carley, K. M. (2020). Bot impacts on public sentiment and community structures: Comparative analysis of three elections...
- Varol, O., Ferrara, E., Davis, C. A., Menczer, F., & Flammini, A. (2017). Online human-bot interactions: Detection, estimation, and characterization....
- Velayutham, T., & Tiwari, P. K. (2017). Bot identification: Helping analysts for right data in Twitter. In 2017 3rd International Conference...
- Wu, J., Teng, E., & Cao, Z. (2022). Twitter bot detection through unsupervised machine learning. In Proceedings - 2022 IEEE International...
- Yousefinaghani, S., Dara, R., Mubareka, S., Papadopoulos, A., & Sharif, S. (2021). An analysis of COVID-19 vaccine sentiments and opinions...
- Zhang, L., Gou, Z., Fang, Z., Sivertsen, G., & Huang, Y. (2023). Who tweets scientific publications? A large-scale study of tweeting audiences...

Mi Ágora

Selección

Opciones de artículo

Seleccionado

Opciones de compartir

Opciones de entorno

Sugerencia / Errata

Acceso de usuarios registrados

Usando análisis de sentimientos para diferenciar bots y humanos en la difusión de publicaciones científicas sobre COVID-19 en la red social X: un estudio con ChatGPT 3.5 y Gemini 1.5 Flash

Mi Ágora

Opciones de artículo

Opciones de compartir

Opciones de entorno