Objetivo. Los datos de investigación se refieren a registros factuales utilizados como recursos primarios de investigación científica. La reutilización de metadatos de datos de investigación proporciona una nueva perspectiva, permitiendo la presentación de nuevas pruebas, hipótesis y nuevos desarrollos de investigación. Este estudio pretende identificar la naturaleza de los tipos de datos de investigación en Geociencias a partir de la reutilización de metadatos del PANGEA Data Publisher for Earth and Environmental Science disponible en (https://www.pangaea.de/). La pregunta de investigación a analizar es ¿Pueden los procesos de análisis y manipulación de metadatos de datos de investigación PANGEA utilizarse para definir un concepto de datos de investigación en Geociencias? Para abordar esta pregunta, se consideraron los atributos de especificación de datos utilizados por las revistas de datos para describir la naturaleza de los datos de investigación: dominio de especialización, accesibilidad, idioma, tipo de datos, adquisición, ubicación de la fuente, área temática específica y publicaciones relacionadas.
Método. La metodología involucró la recolección, análisis y visualización de metadatos de datos de investigación de PANGEA. En total, se descargaron (426,272) registros del repositorio de datos y se compararon con las especificaciones de datos utilizadas por las revistas para describir los datos en los artículos.La metodología en cuestión consistió en recopilar, analizar y visualizar los metadatos de datos de investigación de PANGEA. En total, se descargaron (426.272) registros del repositorio de datos y se compararon con las especificaciones de datos utilizadas por las revistas de datos para describir la naturaleza de los datos de investigación en los documentos de datos. La metodología requirió la aplicación de técnicas y tecnologías utilizadas para el análisis descriptivo, la recuperación de información, la manipulación de datos y la visualización de metadatos Dublin Core. Estas técnicas se implementaron utilizando el lenguaje de programación Python y otros software de manipulación de datos, incluyendo OpenRefine y VOSviewer.
Resultados. Los resultados de nuestro análisis sugieren un examen detallado de los metadatos de (137.218) registros de datos de investigación de (6) seis colecciones de Geociencias. El número de registros en la colección de Geoquímica es de (73.992), en la colección de Ciencias Atmosféricas es de (32.314), en la colección de Paleontología es de (25.903), en la colección de Oceanografía es de (22.287), en la colección de Geofísica es de (4.175), y en la colección de Hidrología, es de (834). Las (6) seis colecciones de metadatos de datos de investigación de PANGEA permiten discutir un concepto de datos de investigación en Geociencias como un tipo de datos sobre estudios relacionados con la Tierra, la atmósfera y los océanos, a través de diferentes geo-disciplinas. Los datos proceden de una serie de disciplinas, como la geoquímica, la ciencia atmosférica, la paleontología, la oceanografía, la geofísica y la hidrología, y utilizan tecnologías como los satélites, los microscopios electrónicos, sensores climáticos, barcos de investigaciones, modelos informáticos y otros. Además, los datos se complementan con otras fuentes relacionadas con el estudio de la Tierra y sus procesos.
Conclusiones. En conclusión, los metadatos de datos de investigación son objetos específicos de un dominio que sirven como valiosos recursos de investigación, independientemente de su momento de uso, finalidad, características de los datos o usuario. Los datos de investigación en geociencias combinan técnicas de laboratorio y de campo, utilizando tecnologías como los satélites y sensores climáticos para estudiar los procesos de la Tierra. Los metadatos PANGEA definen los datos de investigación en geociencias como observaciones, experimentos y modelización. Los datos de investigación en geociencias apoyan la réplica, la reinterpretación y la nueva investigación entre disciplinas, mostrando varias facetas de la reutilización de datos en la investigación científica.