Studies on scientific production data have received attention from researchers in various fields to gain insight into the evolution of research in general. Such studies allow the analysis of scientific production for various purposes and one of the challenges in this type of analysis lies in the diversity of repositories containing data in different formats and structures. In addition, problems such as data redundancy, ambiguity, and incorrect data make the analysis even more complex. In this article, an analysis of the curricular data of Brazilian researchers enrolled in the Lattes Platform is carried out. The amount of data analyzed makes it possible to obtain a view of the whole set consisting of millions of curricula, and contains data on scientific publications, training level, areas of activity, among others. In the results presented, it is possible to obtain an overview of the Brazilian scientific production and the profile of the productivity of the doctors who have worked in Brazil.
Os estudos sobre dados de produções científicas têm recebido atenção de pesquisadores, de diversas áreas, que visam obter conhecimento sobre a evolução das pesquisas em geral. Tais estudos possibilitam a análise da produção científica para diversos propósitos e um dos desafios neste tipo de análise está na diversidade de repositórios contendo dados em formatos e estruturas distintas. Além disso, problemas como redundância dos dados, ambiguidade e dados incorretos tornam as análises ainda mais complexas. Neste artigo, é realizada uma análise dos dados curriculares de pesquisadores brasileiros cadastrados na Plataforma Lattes. A quantidade de dados analisados possibilita obter uma visão de todo o conjunto que é composto por milhões de currículos, e que contém dados sobre publicações científicas, nível de formação, áreas de atuação, dentre outros. Nos resultados apresentados, é possível obter uma visão sobre a produção científica brasileira e qual o perfil da produtividade dos doutores que tem atuado no Brasil.