Aprendizaje semi-supervisado en modelos de puntajes crediticios

Ponente(s): Rafael Miranda Cordero
Los credit scoring models se emplean para estimar la probabilidad de cumplimiento de pagos de un prospecto de crédito de consumo, estos son relevantes para controlar el riesgo en el sector financiero. Bajo el paradigma usual los credit scoring models se plantean como de aprendizaje supervisado y presentan sesgo de supervivencia. Para lidiar con el problema del sesgo típicamente se utilizan técnicas de inferencia de rechazo (reject inference), no obstante, una manera novedosa de tratarlo es mediante modelos de aprendizaje semi-supervisado. En el presente trabajo,a través de un ejemplo real del sector financiero, se comparan las metodologías de aprendizaje semi-supervisado con máquinas de soporte vectorial (ver [1]) con los métodos clásicos basados en regresión logística e inferencia de rechazos: Augmentation, Fuzzy Augmentation y Clustering (ver [2]). Referencias [1]Zhiyong Li, et al. Reject inference in credit scoring using semi-supervised support vector machines. Expert Systems with Applications, 74:105–114, 2017. [2]Naeem Siddiqi. Intelligent Credit Scoring: Building and Implementing Better Credit Risk Scorecards. John Wiley & Sons, Inc., Hoboken, New Jersey, USA, second edition, 2017.