Salamanca, España
Desde hace décadas diferentes organismos internacionales han diseñado pruebas de evaluación internacional a gran escala (ILSA) dirigidas a medir el rendimiento de los estudiantes y tratando de establecer comparaciones entre los sistemas educativos. Se presenta una revisión sistemática de la literatura que pretende conocer la evolución y las características de los análisis secundarios de tres ILSA (PISA, TIMSS y PIRLS), así como identificar posibles mejoras y futuras líneas de investigación. Se realizaron búsquedas en tres repositorios: Web of Science, Scopus y ERIC, centrados en análisis secundarios de datos de estas pruebas desarrolladas desde el año 2000 cuyo objetivo principal era analizar cuestiones relacionadas con los predictores del rendimiento y la eficacia escolar. Tras aplicar diferentes criterios, se seleccionaron 63 artículos de los 470 identificados. Este análisis ha permitido identificar el aumento del interés por este tema en los últimos años, la falta de estudios en determinadas regiones o la prevalencia de la metodología multinivel. La revisión también ha puesto de manifiesto algunas limitaciones de la literatura existente, como la falta de consideración de los problemas inherentes al diseño de evaluaciones a gran escala, así como los relacionados con los datos utilizados para el análisis, como por ejemplo la imposibilidad de establecer relaciones causales o la falta de datos a nivel de aula. Estos resultados sirven de base para hacer algunas recomendaciones, así como para detectar áreas menos exploradas, como las variables relacionadas con el currículo o las variables a nivel de país.
Different international agencies have designed large-scale assessment tests (ILSA) for decades to measure student performance and establish comparisons between education systems. We present a systematic review of the literature that aims to learn about the evolution and characteristics of the secondary analyses of three ILSAs (PISA, TIMSS, and PIRLS) and identify possible improvements and future lines of research. We searched three repositories: Web of Science, Scopus, and ERIC, focused on secondary analyses of data from these tests developed since 2000, whose main objective was to analyze questions related to predictors of school performance and effectiveness. After applying different criteria, 63 articles were selected from the 470 identified. This analysis allowed us to identify the increase in interest in this topic over the last few years, the lack of studies in certain regions, and the prevalence of multilevel methodology. The review has also highlighted some limitations in the existing literature, such as the lack of consideration of the elements inherent to the design of large-scale evaluations, as well as those inherent to the data used for the analysis, such as the impossibility of establishing causal relationships or the lack of data at the classroom level. These results are used to make recommendations and detect less explored areas, such as curriculum-related or country-level variables.