México
El principal riesgo que enfrentan las Sociedades Cooperativas de Ahorro y Préstamo según la Comisión Nacional Bancaria y de Valores, es el crédito. En este artículo se aplican modelos híbridos de aprendizaje computacional para la predicción del riesgo crediticio de solicitudes de clientes pertenecientes a estas sociedades, además se describe la importancia de la selección de características y la reducción de la dimensionalidad, combinando métodos de aprendizaje no supervisado y supervisado. Los experimentos mostraron que los modelos híbridos en conjunto con técnicas de selección de características superan a los algoritmos de aprendizaje computacional de manera individual utilizando todas las características de los conjuntos de datos analizados. Los conjuntos están desbalanceados, por lo cual se utiliza el método de SMOTE para sobre muestrear la clase minoritaria y equilibrar la cantidad de elementos durante el entrenamiento. Los resultados obtenidos confirman que la combinación de métodos no supervisados y supervisados generan una mejora del 6% en el accuracy en comparación con los modelos del estado del arte y 10% en la reducción del error del tipo II para las bases de datos públicas analizadas
According to the National Banking and Securities Commission, the main risk faced by Savings and Loan Cooperative Societies is credit. This paper applies hybrid computational learning models to predict the credit risk of applications from customers belonging to these societies, and describes the importance of feature selection and dimensionality reduction, combining unsupervised and supervised learning methods. Experiments showed that hybrid models in conjunction with feature selection techniques outperform computational learning algorithms individually using all the features of the analyzed data sets. The data sets are unbalanced, so the SMOTE method is used to oversample the minority class and balance the number of features during training. The results obtained confirm that the combination of unsupervised and supervised methods generate a 6% improvement in accuracy compared to the state of the art models and 10% reduction in type II error for the analyzed public databases