Yolanda Blasco Gil , Luis M. González, Armando Pavón Romero, Mariano Mercado Estrada, Carlos Pavón Romero, Ana M. Cabrera, María Fernanda Garzón Farinós, María Fernanda Peset Mancebo
La aplicación de métodos automatizados en cualquier investigación ha facilitado el trasvase de metodologías de una disciplina a otra, permitiendo realizar análisis cuantitativos a textos con estructura o semiestructurados. El objeto de este trabajo es aplicar a un dataset en lenguaje natural -castellano del siglo XVIII- métodos de análisis de la disciplina de documentación. Pretende establecer una metodología automática de análisis cuantitativo y cualitativo de textos, que permita enriquecer en el futuro las conclusiones procedentes del análisis histórico tradicional. Este estudio construye los procedimientos necesarios para poder aplicar análisis de frecuencia, extracción y clasificación de palabras y la construcción de clústeres y redes neuronales con un dataset preexistente, de características muy singulares. Permite validar diferentes utilidades de herramientas y automatizar parte del trabajo de los historiadores, para la edición de los corpus documentales de los claustros universitarios.
Applying automated methods to documents allows performing quantitative analysis of structured or semistructured texts. This work aims to establish an automatic methodology for the quantitative and qualitative analysis of texts that may, in the future, enrich the conclusions drawn from traditional historical analysis. This work establishes the necessary procedures to be able to apply word frequency analysis, extraction and classification of words and the construction of clusters and networks with a pre-existing dataset, with unique characteristics. It allows the validation of different tool utilities and the automation of part of the work of the historians for the edition of the next documentary corpus of cloisters.