Hubner Janampa Patilla, Edgar Gutiérrez Gómez, Adolfo Quispe Arroyo, Roly Auccatoma Tinco
His study explores the application of Generative Adversarial Networks (GANs) in the creation of images of Wari pottery, an artistic expression of the ancient Wari civilization of Peru. Using a dataset of Wari pottery images, we train a GAN to generate new images that capture the distinctive features of this preColumbian art. The results obtained demonstrate the remarkable ability of GANs to produce realistic images, offering significant implications for the preservation and analysis of historical artifacts. This advancement not only facilitates the digital conservation of Wari pottery, but also provides an innovative tool for scholars of art and archaeology. Furthermore, the use of GANs in this context opens new avenues for the reproduction and appreciation of cultural heritage, allowing broader and more detailed access to ancient artworks. The research underlines the potential of artificial intelligence technologies in the field of historical and cultural heritage preservation, marking a milestone in the integration of modern techniques with the study of ancient civilizations. For the generation of the images, the parameters of the images and the latent space used in a Generative Adversarial Network (GAN) were defined. The images were configured with a height of 128 pixels and a width of 128 pixels. In addition, it is specified that the images will have a single channel, which means that they will be in grayscale. These parameters are combined in a tuple to define the complete shape of the images resulting in the vector (128, 128, 1). The dimension of the latent space is set to 100, which is the size of the noise vector that is introduced into the generator to create images. This 100-dimensional vector provides the input to the generator, which then transforms it into a 128x128 pixel grayscale image. For the optimizer, Adam is used, which is initialized with two important parameters, the learning rate, set to 0.0002, and the beta_1 parameter, set to 0.5. The final results show an error rate in the discriminator of 0.09177386 and an error rate in the generator of 3.54049491, at epochs 100,000, where an accuracy rate in image generation of 96.875% is obtained. The GAN was executed on a computer with Microsoft Windows 11 Pro operating system, 12th Gen Intel(R) Core(TM) i7-12700H processor, NVIDIA GeForce RTX 3070 Ti graphics card with 8 GB of GDDR6X memory and 32 GB of RAM, and lasted 20 hours of training on average.
Este estudio explora la aplicación de Redes Generativas Antagónicas (GAN) en la creación de imágenes de cerámica Wari, una expresión artística de la antigua civilización Wari del Perú. Al utilizar un conjunto de datos de imágenes de cerámica Wari, entrenamos una GAN para generar nuevas imágenes que capturan las características distintivas de este arte precolombino. Los resultados obtenidos demuestran la notable capacidad de las GAN para producir imágenes realistas, ofreciendo implicaciones significativas para la preservación y el análisis de artefactos históricos. Este avance no solo facilita la conservación digital de la cerámica Wari, sino que también proporciona una herramienta innovadora para los estudiosos del arte y la arqueología. Además, el uso de GAN en este contexto abre nuevas vías para la reproducción y la apreciación del patrimonio cultural, permitiendo un acceso más amplio y detallado a las obras de arte antiguas. La investigación subraya el potencial de las tecnologías de inteligencia artificial en el ámbito de la preservación del patrimonio histórico y cultural, marcando un hito en la integración de técnicas modernas con el estudio de civilizaciones antiguas. Para la generación de las imágenes se definió los parámetros de las imágenes y el espacio latente utilizados en una Red Generativa Adversarial (GAN). Las imágenes se configuraron con una altura de 128 píxeles y una anchura de 128 píxeles. Además, se especifica que las imágenes tendrán un solo canal, lo que significa que estarán en escala de grises. Estos parámetros se combinan en una tupla para definir la forma completa de las imágenes resultando el vector (128, 128, 1). Se establece la dimensión del espacio latente a 100, que es el tamaño del vector de ruido que se introduce en el generador para crear imágenes, este vector de 100 dimensiones proporciona la entrada al generador, que luego lo transforma en una imagen de 128x128 píxeles en escala de grises, para el optimizador se usa Adam que se inicializa con dos parámetros importantes, la tasa de aprendizaje, configurada en 0.0002, y el parámetro beta_1, configurado en 0.5. Los resultados finales muestran una tasa de error en el discriminador de 0.09177386 y una tasa de error en el generador de 3.54049491, en la epoch 100,000, en donde se obtiene una tasa de precisión en la generación de imágenes de 96.875%. La ejecución de la GAN se realizó en una computadora con sistema operativo Microsoft Windows 11 Pro, procesador 12th Gen Intel(R) Core (TM) i7-12700H, tarjeta gráfica NVIDIA GeForce RTX 3070 Ti con 8 GB de memoria GDDR6X y 32 GB de memoria RAM, y duro 20 horas de entrenamiento en promedio.