En el marco de un proyecto financiado por el CAC (Consell de l�Audiovisual de Catalunya), se realizó una aproximación comunicológica al problema de la selección de palabras clave para la clasificación temática de noticias de televisión a partir de sistemas de reconocimiento automático. Aplicamos análisis del discurso (entorno al concepto �tema�), teoría de la noticia y técnicas lexicométricas y de recuperación de la información, para definir un Protocolo Integral de Selección de Palabras clave. Del trabajo de 4 investigadores con este protocolo sobre una muestra transcrita de 698 noticias ha resultado un lexicon de 1000 palabras clave distribuidas en 15 temas, contrastado mediante el estadístico Lambda de Wilks.
In the framework of a research project funded by CAC, a communication approach was taken to the problem of keywords selection for the themes indexing of TV news by word spotting. This is, we apply discourse theories (concept of �themes�), news theory and lexicometry and information retrieval techniques, for the definition of a complex Protocol of Keywords Selection. The work of 4 researchers with this protocol on a 698 transcript news sample resulted in a lexicon of 1000 keywords distributed in 15 themes, which is contrasted statistically with Lambda of Wilks.