Resumen El Sistema Nacional de Investigadores de México (SNI) evalúa, selecciona y reconoce, mediante un estímulo económico, el capital humano nacional que realiza investigación de calidad. Esta logística puede ser considerada como una selección de proyectos, la cual conlleva, obligatoriamente, a la elección de capital humano especializado. En este artículo se utiliza la técnica de análisis y agrupamiento de datos conocida como clustering (k Means) para profundizar sobre los criterios seguidos por el SNI en cuanto a dicha elección de investigadores. Una vez que se conoce el perfil productivo de cada nombramiento definido por el SNI, y a través de la distancia de Hamming, se realiza un análisis comparativo entre los datos estimados y reales asociados a cada nombramiento. Las estimaciones permitieron concluir que no se justifica la actual clasificación en cuatro agrupaciones (nombramientos), tal vez ello se deba a que los evaluadores del SNI utilizan información no recolectada en las variables reportadas por las solicitudes. Además, se demuestra la necesidad de mejorar la información estadística utilizada como base de datos para la evaluación; se señalan las diferencias en las clasificaciones estimadas para las siete áreas del conocimiento definidas por el SNI y se recomiendan algunos de los resultados para complementar las evaluaciones por pares, realizadas actualmente, siempre que se mejore la cantidad y calidad de la información disponible. Sin duda, ello debe de servir para hacer más eficiente la futura selección de proyectos de investigación y desarrollo concernientes a un programa de la política pública de investigación en México.
Abstract The National System of Researchers of Mexico (SNI) evaluates, selects, and recognized by an economic stimulus to national human capital that makes quality research. This logistics can be considered as a selection of projects, which leads, inevitably, to the choice of specialized human capital. This article uses the technique of analysis and clustering of data known as clustering (k Means) to deepen on the criteria followed by the NSR with regard to the choice of researchers. Once the productive profile of each appointment defined by SNI, and through the Hamming distance is known, is a comparison between the actual and estimated data associated with each appointment. Estimates allowed to conclude that it is not justified the current classification into four groups (appointments), perhaps this is due to that the evaluators of the SNI used information not collected on variables reported by requests. In addition, demonstrates the need for improved statistical information used as the database for the evaluation; the differences that exist in the ratings for the seven knowledge areas defined by the SNI and recommended some of the results to supplement assessments by peers today, provided that improvements are designated the quantity and quality of available information. Certainly, this should serve to streamline the future selection of projects of research and development concerning a programme of public policy research in Mexico.