Críspulo Travieso Rodríguez, Ronaldo Ferreira de Araújo
Los datos abiertos de investigación constituyen una oportunidad para el desarrollo colaborativo de la ciencia y abren nuevas perspectivas para la validación y difusión de los resultados científicos. La reutilización efectiva de estos datos requiere conocer tanto los procedimientos empleados para su obtención como las métricas de uso y consumo que van acumulando. El presente trabajo toma la colección íntegra de datos abiertos (348 datasets) de las revistas de SciELO disponibles para su consulta desde Figshare, con el objetivo de examinar sus metodologías de investigación y la naturaleza de los datos, en función de cómo han sido obtenidos y según sus categorías temáticas. Asimismo, se recopilan sus indicadores de uso y citación, los formatos de archivo y sus licencias de utilización. Los resultados muestran una mayoría de estudios cuantitativos frente a los cualitativos. Los conjuntos de datos más frecuentes son los obtenidos mediante observación, seguidos de los experimentales y derivados, aunque con variación en función de las disciplinas científicas, mientras que los indicadores de uso resultaron ser poco significativos aún para toda la colección.
Open research data represent an opportunity to share scientific knowledge and to provide new perspectives for validation and dissemination of scientific results. Effective re-use of these data implies to know both the research methods applied to obtain them and the measures of usage and citation that are sistematically gathered. Based on the whole catalogue of open research data (348 datasets) from SciELO journals available in Figshare, this study aims to explore their research methods and the types of data according to data collection techniques and subject categories. It also analyses usage and bibliometric indicators, file formats and dataset licensing. Results show that quantitative data are more frequent than qualitative data. The most usual data were those obtained by observation techniques, followed by experimental and derived data. This figures varied according to the different scientific areas, but usage indicators came out not to be significant for the whole set of data files.