La IAG de voz es capaz de generar mensajes en lenguaje humano, mediante algoritmos de aprendizaje profundo, como las redes neuronales convolucionales o CNN, que aprenden a imitar los patrones vocales a partir de datos de habla. Ante este contexto, el principal objetivo es ofrecer una radiografía de la IAG de voz aplicada al podcasting para responder si la actual oferta tecnológica representa una amenaza para los empleos de los profesionales del audio, en particular para los/as locutores/as. Con este fin, se analizan los principales software que emplean los creadores de pódcast para la clonación de voz y se establece un marco comparativo. En segundo lugar, se recopilan las percepciones de los creadores acerca de los resultados obtenidos mediante el análisis de 10 títulos. Los principales software ofrecen herramientas específicas, que pueden mejorar el flujo de trabajo y optimizar los costes de producción. Gracias a los resultados sobre el estado actual de la IAG de voz aplicada al podcasting, hemos identificado tanto las oportunidades como las limitaciones que esta tecnología ofrece a los creadores.se observa que la industria de la IAG de voz está adaptándose a las necesidades del sector, ofreciendo múltiples herramientas a través de plataformas especializadas que permiten clonar la voz, editar grabaciones, publicar pódcast y distribuirlos en varios idiomas. Sin embargo, no se interpreta como una amenaza inmediata debido a la reproducción de una prosodia inexacta y la ausencia de elementos paralingüísticos.
Voice-generative artificial intelligence (GAI) is capable of generating messages in human language using deep learning algorithms, such as convolutional neural networks (CNN), which learn to imitate vocal patterns from speech data. Against this background, the main objective is to provide an x-ray of voicegenerative artificial intelligence (GAI) applied to podcasting in order to answer whether the current technological offer represents a threat to the jobs of audio professionals, particularly for voice-over artists. To this end, the main software used by podcast creators for voice cloning is analysed and a comparative framework is established. Secondly, the perceptions of the creators about the results obtained by analysing 10 titles are collected. The main software offers specific tools, which can improve the workflow and optimise production costs. Thanks to the results on the current state of voice-generative artificial intelligence (GAI) applied to podcasting, we have identified both the opportunities and the limitations that this technology offers to creators