Unité mixte de recherche 7235

Scaling up SME’s credit scoring scope with LightGBM

Bastien Lextrait

Les Petites et Moyennes Entreprises (PME) sont des acteurs essentiels du tissu économique. Leur croissance est souvent limitée par la difficulté à obtenir des financements. Les accords de Bâle II ont imposé aux banques l’obligation d’estimer la probabilité de défaut de leurs débiteurs. Les modèles actuellement utilisés sont limités par la simplicité de leur architecture et le peu de données disponibles. L’usage des modèles d’apprentissage machine de pointe reste marginal, car ils sont souvent considérés comme des boîtes noires ne pouvant pas être facilement expliquées ou interprétées. Nous proposons une méthodologie pour allier interprétabilité et fort pouvoir prédictif, en appliquant diverses implémentations de méthodes de Gradient Boosting Decision Trees (GBDT) comme le LightGBM, ainsi que les valeurs SHAP (SHapley Additive exPlanation) comme méthode d’interprétation post-prédiction. Les valeurs SHAP font partie des méthodes les plus récentes quantifiant avec cohérence l’impact de chaque variable d’entrée sur le score final. Le modèle est développé et testé sur un échantillon national d’entreprises françaises, avec un fort déséquilibre en évènements positifs. Les performances des modèles GBDT sont comparées à celles d’algorithmes traditionnels de notation de crédit, comme le Support Vector Machine (SVM) et la Régression Logistique. Le LightGBM procure les meilleures performances statistiques et économiques sur l’échantillon de test, tout en restant rapide à entraîner. Les résultats analytiques obtenus avec les valeurs SHAP sont cohérents avec les précédentes études socio-économiques, car identifient avec précision des ratios économiques influents connus parmi des centaines d’autres variables. Être en mesure de fournir un tel niveau d’interprétabilité à des modèles complexes pourrait convaincre les régulateurs d’accepter leur utilisation dans les méthodes automatisées de notation de crédit, ce qui pourrait en fin de compte profiter tant aux emprunteurs qu’aux prêteurs.

AGENDA

lundi 23 mai 2022

Law, Institutions and Economics in Nanterre (LIEN)

Clara Jean (Grenoble Ecole de Management)

The Value of Your Data: Privacy and Personal Data Exchange Networks

lundi 30 mai 2022

Law, Institutions and Economics in Nanterre (LIEN)

Antoine Dubus (ETH Zurich)

Salle G110

Data Driven Mergers and Acquisitions with Information Synergies

mardi 31 mai 2022

Series of Webinars on Economics of Environment, Energy and Transport (SWEEET)

Juan Pablo Montero (PUC)

TBA

jeudi 9 juin 2022

Lunch

Rémi Generoso

TBA

jeudi 9 juin 2022

Groupe de travail « Intelligence artificielle »

Hugo Le Picard (IFRI)

Salle G614B

Le deep learning au service de l’analyse des énergies renouvelables en Afrique

mardi 14 juin 2022

Series of Webinars on Economics of Environment, Energy and Transport (SWEEET)

Andrew Plantiga (UCSB)

TBA

mercredi 15 juin 2022

Économies du monde musulman

Amel Bouzid (CREAD, Alger)

Natural and Regulatory Underlying Factors of Food Dependency in Algeria

lundi 20 juin 2022

Law, Institutions and Economics in Nanterre (LIEN)

Wilfried Sand Zantman (ESSEC Business School)

Hitting the Right Target? Pricing and Advertising Strategies in Digital Markets

Inscription aux Newsletters