
Modélisation avancée
23 juin 2024
Le projet vise à modéliser l'appétence au crédit des clients d'une société financière. Cela inclut le nettoyage des données et l'optimisation des variables pour maximiser les performances. Les résultats sont évalués à l'aide de deux indicateurs clés : l'indice de Gini, qui mesure la performance du modèle par rapport à un modèle parfait ou aléatoire, et le Gain Chart, qui aide à déterminer les seuils de score pour identifier les clients appétants.
Nous avons modélisé l’appétence au crédit des clients d’une société financière en exploitant un jeu de données contenant des informations détaillées sur les comportements de crédit. Le projet s’est structuré en plusieurs étapes clés :
Nettoyage et exploration des données :
Suppression des valeurs aberrantes et des doublons.
Normalisation des données pour assurer une échelle uniforme.
Analyse exploratoire pour identifier les variables explicatives les plus pertinentes.
Modélisation :
Utilisation de plusieurs algorithmes, notamment la régression logistique, les forêts aléatoires, le Gradient Boosting Machine (GBM) et le Support Vector Machine (SVM).
Évaluation des performances des modèles avec deux indicateurs principaux :
Indice de Gini : Mesure la qualité de discrimination du modèle.
Gain Chart : Aide à fixer des seuils de score pour évaluer l’appétence.
Résultats et conclusions :
Le modèle Random Forest a présenté les meilleures performances en termes de précision et de capacité à discriminer les classes.
Les résultats suggèrent que ce modèle est le plus adapté pour prédire l’appétence au crédit et optimiser la prise de décision de l’entreprise.
En conclusion, ce projet fournit une solution robuste pour identifier les clients les plus susceptibles de souscrire à un crédit, tout en optimisant les processus décisionnels et la gestion des risques financiers.