Unité mixte de recherche 7235

Scaling up SME’s credit scoring scope with LightGBM

Bastien Lextrait

Les Petites et Moyennes Entreprises (PME) sont des acteurs essentiels du tissu économique. Leur croissance est souvent limitée par la difficulté à obtenir des financements. Les accords de Bâle II ont imposé aux banques l’obligation d’estimer la probabilité de défaut de leurs débiteurs. Les modèles actuellement utilisés sont limités par la simplicité de leur architecture et le peu de données disponibles. L’usage des modèles d’apprentissage machine de pointe reste marginal, car ils sont souvent considérés comme des boîtes noires ne pouvant pas être facilement expliquées ou interprétées. Nous proposons une méthodologie pour allier interprétabilité et fort pouvoir prédictif, en appliquant diverses implémentations de méthodes de Gradient Boosting Decision Trees (GBDT) comme le LightGBM, ainsi que les valeurs SHAP (SHapley Additive exPlanation) comme méthode d’interprétation post-prédiction. Les valeurs SHAP font partie des méthodes les plus récentes quantifiant avec cohérence l’impact de chaque variable d’entrée sur le score final. Le modèle est développé et testé sur un échantillon national d’entreprises françaises, avec un fort déséquilibre en évènements positifs. Les performances des modèles GBDT sont comparées à celles d’algorithmes traditionnels de notation de crédit, comme le Support Vector Machine (SVM) et la Régression Logistique. Le LightGBM procure les meilleures performances statistiques et économiques sur l’échantillon de test, tout en restant rapide à entraîner. Les résultats analytiques obtenus avec les valeurs SHAP sont cohérents avec les précédentes études socio-économiques, car identifient avec précision des ratios économiques influents connus parmi des centaines d’autres variables. Être en mesure de fournir un tel niveau d’interprétabilité à des modèles complexes pourrait convaincre les régulateurs d’accepter leur utilisation dans les méthodes automatisées de notation de crédit, ce qui pourrait en fin de compte profiter tant aux emprunteurs qu’aux prêteurs.

AGENDA

mardi 31 janvier 2023

Recherche et Economie et Socioéconomie Politique, des Institutions et des Régulations (RESPIR)

Nathalie Heinich (EHESS)

ANNULÉ ET REPORTÉ À UNE DATE ULTÉRIEURE

Valeur et mesure: aux limites de l’approche économique

mardi 31 janvier 2023

Series of Webinars on Economics of Environment, Energy and Transport (SWEEET)

Aurelien Saussay(OFCE, Sciences Po, Paris), Misato Sato, (London School of Economics and Political Science) Francesco Vona (University of Milan) Layla O’Kane(Lightcast)

En visio

Who’s fit for the low-carbon transition? Emerging skills and wage gaps in job ad data

jeudi 2 février 2023

Lunch

Nabil Daher, Michaël Guilloussou, Daniela Lima Rente, Maryam Soltani

Nouveaux doctorants

jeudi 2 février 2023

Groupe de travail Economie Comportementale

Carole Treibich (Laboratoire d'Economie Appliquée de Grenoble GAEL)

Salle 101

Disentangling peer effects in transportation mode choice: the example of active commuting

jeudi 2 février 2023

Groupe de travail « Intelligence artificielle »

Aurélien Quignon (Université du Luxembourg)

Salle : G614B

Crowd-Based Feedback and Early-Stage Entrepreneurial Performance: Evidence from a Digital Platform

mardi 7 février 2023

Recherche et Economie et Socioéconomie Politique, des Institutions et des Régulations (RESPIR)

Tristan Velardo (Sciences Po Bordeaux, Centre Emile Durkheim)

From the primitive mentality to the civilization of capitalism: Schumpeter, reader of Lévy-Bruh

mardi 7 février 2023

Développement Durable Environnement et Energie (DDEE)

Emmanuelle Lavaine (CEE-M - University of Montpellier)

Flood Risk Information: Evidence from Paris Housing Markets

jeudi 9 février 2023

Doctorants

Claire Mollier

Gender, competitiveness, and reaction to defeat

Inscription aux Newsletters