Les Petites et Moyennes Entreprises (PME) sont des acteurs essentiels du tissu économique. Leur croissance est souvent limitée par la difficulté à obtenir des financements. Les accords de Bâle II ont imposé aux banques l’obligation d’estimer la probabilité de défaut de leurs débiteurs. Les modèles actuellement utilisés sont limités par la simplicité de leur architecture et le peu de données disponibles. L’usage des modèles d’apprentissage machine de pointe reste marginal, car ils sont souvent considérés comme des boîtes noires ne pouvant pas être facilement expliquées ou interprétées. Nous proposons une méthodologie pour allier interprétabilité et fort pouvoir prédictif, en appliquant diverses implémentations de méthodes de Gradient Boosting Decision Trees (GBDT) comme le LightGBM, ainsi que les valeurs SHAP (SHapley Additive exPlanation) comme méthode d’interprétation post-prédiction. Les valeurs SHAP font partie des méthodes les plus récentes quantifiant avec cohérence l’impact de chaque variable d’entrée sur le score final. Le modèle est développé et testé sur un échantillon national d’entreprises françaises, avec un fort déséquilibre en évènements positifs. Les performances des modèles GBDT sont comparées à celles d’algorithmes traditionnels de notation de crédit, comme le Support Vector Machine (SVM) et la Régression Logistique. Le LightGBM procure les meilleures performances statistiques et économiques sur l’échantillon de test, tout en restant rapide à entraîner. Les résultats analytiques obtenus avec les valeurs SHAP sont cohérents avec les précédentes études socio-économiques, car identifient avec précision des ratios économiques influents connus parmi des centaines d’autres variables. Être en mesure de fournir un tel niveau d’interprétabilité à des modèles complexes pourrait convaincre les régulateurs d’accepter leur utilisation dans les méthodes automatisées de notation de crédit, ce qui pourrait en fin de compte profiter tant aux emprunteurs qu’aux prêteurs.