This work carries out a comprehensive analysis and survey of publications in the area of Artificial Intelligence available in the repositories of universities and federal institutes in the northern region of Brazil, from2011 to 2021. The objective of this investigation is to examine a set of data composed of academic works in the area of information technology and technologies in the North of Brazil, aiming to extract relevant information about research carried out in Public Higher Education Institutions. This is achieved through the application of machine learning, data mining and clustering techniques. The WEKA program was used, which contains algorithms from different approaches in the subarea of artificial intelligence. The algorithm, Farthest First, was chosen for this study due to its proven effectiveness in similar works. This analysis covers seven clusters representing different institutions and academic contexts, aiming to cover the main areas of research. The main result obtained from this work was the identification of significant patterns, highlighting the influence of institutional factors, local demands and characteristics of academic programs on the choice of topics for academic work, in Artificial Intelligence research in the region, revealing valuable insights into the trends, and indicate possible areas that have not yet been explored or that have received little attention to date.
Este trabalho realiza uma análise abrangente e levantamento das publicações na área de Inteligência Artificial disponíveis nos repositórios das universidades e institutos federais da região norte do Brasil, no período de 2011 a 2021. O objetivo desta investigação é examinar um conjunto de dados composto por trabalhos acadêmicos na área de informática e tecnologias da região Norte do Brasil, visando extrair informações relevantes sobre as pesquisas desenvolvidas em Instituições Públicas de Ensino Superior. Isso é alcançado por meio da aplicação de técnicas de aprendizado de máquina, mineração de dados e clusterização. Utilizou-se o programa WEKA, que contem algoritmos provenientes de diferentes abordagens na subárea da inteligência artificial, foi escolhido o algoritmo, Farthest First, para este estudo devido à sua comprovada eficácia em trabalhos semelhantes. Esta análise abrange sete clusters representativos de diferentes instituições e contextos acadêmicos, visando abranger as principais áreas da pesquisa. O principal resultado obtido a partir deste trabalho foi a identificação de padrões significativos, destacando a influência de fatores institucionais, demandas locais e características dos programas acadêmicos na escolha de temas para trabalhos acadêmicos, nas pesquisas em Inteligência Artificial na região, revelando ideias valiosas sobre as tendências, e indicam possíveis áreas ainda não exploradas ou que tenham recebido pouca atenção até o momento.