Titulación automática de preguntas en encuestas electorales

Carolina Gallardo; Jesús Cardeñosa

Titulación automática de preguntas en encuestas electorales

Gallardo, Carolina ^[1] ; Cardeñosa, Jesús ^[1]
1. [1] Universidad Politécnica de Madrid
  
  Universidad Politécnica de Madrid
  
  Madrid, España
Localización: Revista española de documentación científica, ISSN-e 1988-4621, ISSN 0210-0614, Vol. 39, Nº. 2 (abril-junio 2016), 2016
Idioma: español
DOI: 10.3989/redc.2016.2.1236
Títulos paralelos:
- Automatic Titling of Election Survey Questions
Enlaces
- Texto completo
Resumen
- español
  Este artículo describe el trabajo realizado para la generación automática de los títulos de las preguntas pertenecientes a las encuestas de opinión que existen en las bases de datos del CIS (Centro de Investigaciones Sociológicas). Dentro del contexto del CIS, el título de una pregunta debe cumplir dos requisitos: desde el punto de vista de la forma, debe ser gramaticalmente correcto y tener un estilo similar a los ya existentes; y, desde el punto de vista del contenido, debe albergar el tema de la pregunta y las distintas categorías de respuesta. Estas restricciones en cuanto a la forma y al contenido de los títulos desaconsejan el uso de técnicas empleadas en problemas similares, como el resumen automático o aprendizaje automático con corpus de entrenamiento, a favor de una metodología basada en el análisis y conocimiento del dominio. Para ilustrar el análisis y la estrategia de resolución del problema seguidos, hemos seleccionado las preguntas relacionadas con temas electorales, debido a la importancia estratégica y a la especialización del CIS en este tipo de encuestas. Se describe en detalle el procedimiento seguido y la evaluación de los resultados, valorando tanto los aspectos cualitativos como los cuantitativos. La evaluación muestra que el 88,73% de los títulos generados cumplen estrictamente con los requisitos de forma y contenido impuestos por el CIS, lo que supone un ahorro en el trabajo manual del personal cualificado de la institución.
- English
  This paper describes the work carried out for automatically generating titles for questions included in the opinion polls contained in CIS databases (Centro de Investigaciones Sociológicas – Spanish Center of Sociological Research). In the context of CIS, the title of a question should meet two requirements: from the point of view of form, it has to be grammatically correct and similar in style to existing ones; from the point of view of content, it must contain the subject of the question and the different options for answering. These conditions for form and content of titles discourage the use of techniques used in similar problems, such as automatic abstracting or machine learning with a training corpus, but rather favor a methodology based on an analysis and knowledge of the domain. To illustrate the analysis and the resolution strategy of the problem, we have selected a set of questions related to elections, due to their strategic importance and to CIS’s own specialization in opinion polls. The process followed and the subsequent evaluation of results are discussed in detail, with an assessment of both qualitative and quantitative aspects. The evaluation shows that 88.73% of the generated titles are in strict accordance with CIS’s requisites on form and content, resulting in reduced time spent by the institution’s qualified personnel on manual work.
Referencias bibliográficas
- Cui, H.; Kan M.; Chua T. (2007). Soft pattern matching models for definitional question answering. ACM Transactions on Information Systems,...
- Gallardo Pérez, C.; Carde-osa, J. (2011). Knowledge extraction for question titling. In Proceedings of the 9th international conference on...
- García Gutiérrez, A. (2014). Análisis documental de noticias de prensa en sistemas de información factual. Revista Espa-ola de Documentación...
- Goldstein, J.; Kantrowitz, M.; Mittal, V.; Carbonell, J. (1999). Summarizing text documents: Sentence selection and evaluation metrics. Proceedings...
- Hung, S.; Lin, C.; Hong, J. (2010). Web mining for event-based commonsense knowledge using lexico-syntactic pattern matching and semantic...
- Jin, R.; Hauptmann, E. G. (2001). Headline generation using a training corpus. Proceedings of the Second International Conference on Computational...
- Jin, R.; Hauptmann, A. G. (2002). A new probabilistic model for title generation. Proceedings of the 19th International Conference on Computational...
- Liu, K.; Chapman, W. W.; Savova, G.; Chute, C. G.; Sioutos, N.; Crowley, R. S. (2011). Effectiveness of lexico-syntactic pattern matching...
- Martínez-Ávila, D.; San Segundo, R.; Zurian, F. (2014). Retos y oportunidades en organización del conocimiento en la intersección con las...
- Spärck Jones, K. (2007). Automatic summarising: The state of the art. Information Process.Management, vol. 43(6), pp. 1449-1481. http://dx.doi.org/10.1016/j.ipm.2007.03.009
- Spasic, I.; Sarafraz, F.; Keane, J. A.; Nenadic, G. (2010). Medication information extraction with linguistic pattern matching and semantic...

Mi Ágora

Selección

Opciones de artículo

Seleccionado

Opciones de compartir

Opciones de entorno

Sugerencia / Errata

Acceso de usuarios registrados

Titulación automática de preguntas en encuestas electorales

Universidad Politécnica de Madrid

Mi Ágora

Opciones de artículo

Opciones de compartir

Opciones de entorno