Unité mixte de recherche 7235

Scaling up SME’s credit scoring scope with LightGBM

Bastien Lextrait

Les Petites et Moyennes Entreprises (PME) sont des acteurs essentiels du tissu économique. Leur croissance est souvent limitée par la difficulté à obtenir des financements. Les accords de Bâle II ont imposé aux banques l’obligation d’estimer la probabilité de défaut de leurs débiteurs. Les modèles actuellement utilisés sont limités par la simplicité de leur architecture et le peu de données disponibles. L’usage des modèles d’apprentissage machine de pointe reste marginal, car ils sont souvent considérés comme des boîtes noires ne pouvant pas être facilement expliquées ou interprétées. Nous proposons une méthodologie pour allier interprétabilité et fort pouvoir prédictif, en appliquant diverses implémentations de méthodes de Gradient Boosting Decision Trees (GBDT) comme le LightGBM, ainsi que les valeurs SHAP (SHapley Additive exPlanation) comme méthode d’interprétation post-prédiction. Les valeurs SHAP font partie des méthodes les plus récentes quantifiant avec cohérence l’impact de chaque variable d’entrée sur le score final. Le modèle est développé et testé sur un échantillon national d’entreprises françaises, avec un fort déséquilibre en évènements positifs. Les performances des modèles GBDT sont comparées à celles d’algorithmes traditionnels de notation de crédit, comme le Support Vector Machine (SVM) et la Régression Logistique. Le LightGBM procure les meilleures performances statistiques et économiques sur l’échantillon de test, tout en restant rapide à entraîner. Les résultats analytiques obtenus avec les valeurs SHAP sont cohérents avec les précédentes études socio-économiques, car identifient avec précision des ratios économiques influents connus parmi des centaines d’autres variables. Être en mesure de fournir un tel niveau d’interprétabilité à des modèles complexes pourrait convaincre les régulateurs d’accepter leur utilisation dans les méthodes automatisées de notation de crédit, ce qui pourrait en fin de compte profiter tant aux emprunteurs qu’aux prêteurs.

AGENDA

mardi 5 décembre 2023

Recherche et Economie et Socioéconomie Politique, des Institutions et des Régulations (RESPIR)

Clément Fontan (UC Louvain)

The ECB and the inflation monsters: strategic framing and the responsibility imperative (1998-2023)

jeudi 7 décembre 2023

Groupe de travail Economie Comportementale

Vincent Lenglin (Université Catholique de Lille)

TBA

jeudi 7 décembre 2023

Doctorants

Emmanuelle Faure

Explaining economic performances in the French employment zone: spatial externalities and related variety

lundi 11 décembre 2023

Law, Institutions and Economics in Nanterre (LIEN)

Bastien Michel (LEMNA, Nantes)

Measuring the Impact of Incarceration on Recidivism in Denmark

mercredi 13 décembre 2023

Économies du monde musulman

Chahir Zaki (LEO, Université d’Orléans)

Dette en Egypte : conjoncture défavorable ou structure vulnérable ?

jeudi 14 décembre 2023

Lunch

Hugo ORIOLA

Salle 101-102 à 12h

Opportunistic Political Central Bank Coverage: Does media coverage of ECB’s Monetary Policy Impacts German Political Parties’ Popularity?

jeudi 14 décembre 2023

Développement Durable Environnement et Energie (DDEE)

Emeline Bezin (CNRS/CREM)

Salle 101-102

TBA

jeudi 14 décembre 2023

Séminaire Econom’IA

Benjamin Ooghe-Tabanou (médialab - Sciences Po Paris)

Salle G614A de 11h à 12h30

Outils, méthodes et productions numériques à partir de données du web au médialab de Sciences Po

Inscription aux Newsletters