El análisis de datos educativos ha cobrado cada vez mayor relevancia en la actualidad, siendo una herramienta esencial para comprender y mejorar los procesos de enseñanza y aprendizaje. Este trabajo tiene como objetivo utilizar técnicas de clustering para analizar datos educativos del Instituto Federal de Pará (IFPA), campus Altamira, para los años 2018 a 2021, con el objetivo de generar grupos utilizando el algoritmo Farthest First presente en el software WEKA. Utilizando datos recopilados del sistema académico, el estudio organizó la información de los estudiantes que contiene 15 atributos diferentes, que cubren aspectos tanto socioeconómicos como académicos de los estudiantes. El análisis dio como resultado la formación de seis grupos distintos, cada uno de los cuales representa diferentes perfiles de estudiantes según características como el rendimiento académico, el número de ausencias y el estado del curso. El análisis de conglomerados reveló la complejidad de los factores que influyen en las trayectorias académicas de los estudiantes. El uso del algoritmo Farthest First demostró ser efectivo para identificar patrones relevantes, destacando la importancia de considerar aspectos socioeconómicos y personales además del rendimiento académico para comprender la dinámica de retención y abandono en cursos de educación superior.
The analysis of educational data has gained increasing relevance today, being an essential tool for understanding and improving teaching and learning processes. This work aims to use clustering techniques to analyze educational data from the Instituto Federal do Pará (IFPA), Altamira campus, for the years 2018 to 2021, in order to generate groups using the Farthest First algorithm present in the WEKA software. Using data collected from the academic system, the study organized student information containing 15 different attributes, covering both socioeconomic and academic aspects of students. The analysis resulted in the formation of six distinct clusters, each representing different student profiles based on characteristics such as academic performance, number of absences, and course status. The analysis of the clusters revealed the complexity of the factors that influence students' academic trajectory. The use of the Farthest First algorithm proved to be effective in identifying relevant patterns, highlighting the importance of considering socioeconomic and personal aspects in addition to academic performance to understand the dynamics of permanence and dropout in higher education courses
A análise de dados educacionais tem ganhado crescente relevância na atualidade, sendo uma ferramenta essencial para a compreensão e melhoria dos processos de ensino e aprendizagem. Esse trabalho tem como objetivo utilizar técnicas de clusterização para analisar dados educacionais do Instituto Federal do Pará (IFPA), campus Altamira, referentes aos anos de 2018 a 2021, com intuito de gerar grupos utilizando o algoritmo Farthest First presente no software WEKA. Utilizando dados coletados do sistema acadêmico, o estudo organizou as informações dos discentes contendo 15 atributos diferentes, abrangendo tanto aspectos socioeconômicos quanto acadêmicos dos estudantes. A análise resultou na formação de seis clusters distintos, cada um representando diferentes perfis de alunos com base em características como desempenho acadêmico, número de faltas e situação no curso. A análise dos clusters revelou a complexidade dos fatores que influenciam a trajetória acadêmica dos estudantes. A utilização do algoritmo Farthest First mostrou-se eficaz na identificação de padrões relevantes, destacando a importância de considerar aspectos socioeconômicos e pessoais além do desempenho acadêmico para entender as dinâmicas de permanência e evasão nos cursos superiores.