Virginia Bazán Gil, Carmen Pérez Cernuda, Noemí Marroyo Núñez, Paloma Sampedro Canet, David De Ignacio Ledesma
Se presentan los resultados del proyecto para la segmentación en noticias de los informativos de Radio Nacional de España (RNE) llevado a cabo por el Área de Innovación Tecnológica de Radio Televisión Española (RTVE) en colaboración con la Dirección de Medios de RNE. El objetivo de este proyecto es aplicar la inteligencia artificial para el cortado automático de las noticias que componen un informativo radiofónico, para su posterior difusión en la web de RTVE y en medios de comunicación social. El proyecto se planificó en dos fases: una primera de configuración y ajuste del sistema, y una segunda de prestación del servicio propiamente dicho. Los criterios de calidad mínimos exigibles se definieron previamente, tanto para la transcripción automática del habla a texto, para la que se estableció una tasa de error por palabra máxima (WER) del 10%, como para la segmentación de noticias, para la que se definió una tasa de precisión superior al 85%. El rendimiento del sistema tanto en la transcripción como en la segmentación se considera suficiente, si bien se espera alcanzar un mayor grado de precisión en el cortado de noticias en los próximos meses. Los resultados ponen de manifiesto que, a pesar de ser tecnologías bastante maduras, son necesarios procesos de ajuste y aprendizaje con la intervención humana.
The results of a project on news segmentation at Radio Nacional de España (RNE) carried out by the RTVE Technological Innovation and Media Management areas is presented. The aim of this project is to apply artificial intelligence to automatically transcribe and cut the news items that make up a radio news program. The main goals of this project are to increase the accessibility of the content and to allow its reusability on various platforms and social media. The project was planned in two phases, covering system configuration and service delivery. The minimum quality criteria required were defined in advance, both for automatic voice transcription and for news segmentation. For the speech-to-text process, the highest word error rate (WER) allowed was 10%, while the precision rate for the news segmentation was 85%. System performance in both transcription and segmentation was considered to be sufficient, although a higher degree of accuracy in news cutting is expected in the coming months. The results show that, despite using these quite mature technologies, adjustment and learning processes and human intervention are still necessary.