Verbesserung von Transparenz und Fairness bei automatisierten Kreditentscheidungen: ein erklärbarer neuartiger hybrider Ansatz des maschinellen Lernens

Verbesserung von Transparenz und Fairness bei automatisierten Kreditentscheidungen: ein erklärbarer neuartiger hybrider Ansatz des maschinellen Lernens

Optimierung von Kreditrisikomodellen: Hybridansatz mit 1D-CNN und XGBoost zur Verbesserung der Leistung und Vorhersagegenauigkeit

Die Fortschritte in der Kreditrisikobewertung: Ein hybridisiertes Maschinenlernmodell

In der heutigen, datengetriebenen Welt ist die Fähigkeit, Kreditrisiken effektiv zu bewerten, für Finanzinstitute von entscheidender Bedeutung. In diesem Blogbeitrag werden wir die spannende Untersuchung eines hybriden Maschinenlernmodells beleuchten, das die Stärken von 1D-Convolutional Neural Networks (CNN) und XGBoost vereint, um die Vorhersagegenauigkeit bei der Analyse von Kreditrisiken zu verbessern.

Methodologie und Daten

Für unser Experiment verwendeten wir ein hybrides Modell, das einen 1D-CNN mit dem XGBoost-Algorithmus kombiniert. Diese Methodik arbeitet innerhalb eines generalisierten Stacking-Rahmenwerks, unterstützt durch den SHAP-Algorithmus zur Analyse der Merkmalbedeutung. Die Programmierung erfolgte in Python, unter Verwendung von Jupyter Notebook und Paketen wie Keras, Sklearn, NumPy, Pandas, Shap, Matplotlib und XGBoost Classifier.

Datensatz und Datenvorverarbeitung

Der Datensatz wurde von Kundenkrediten bei Lending Club, einer P2P-Kreditplattform, extrahiert. Er umfasst über eine Million Beobachtungen und beinhaltet 145 Merkmale zu Krediten, die zwischen 2007 und 2018 ausgegeben wurden. Ein wesentlicher Bestandteil der Exploration war die Bereinigung der Daten, bei der Merkmale mit über 40 % fehlenden Werten entfernt und stark korrelierte Merkmale ausgeschlossen wurden. Dies führte zu einem reduzierten Merkmalssatz von 25 Merkmalen und 25.535 Beobachtungen.

Wir nutzen die Min-Max-Skalierung, um die Merkmale in einen Bereich von 0 bis 1 zu normieren, was für viele ML-Modelle von entscheidender Bedeutung ist. Für das Training des Modells wurde der Datensatz in Trainings- (80 %) und Testdaten (20 %) aufgeteilt, um die Leistung des Modells zu validieren.

Das hybride Modell

1D-CNN

1D-CNNs sind besonders gut geeignet, um zeitliche und sequentielle Daten zu analysieren, was sie zur idealen Wahl für die Untersuchung finanzieller Verhaltensmuster macht. Diese Netze extrahieren lokale Merkmale aus den Zeitreihen der Kredithistorie und helfen, Muster zu identifizieren, die auf ein erhöhtes Risiko von Zahlungsausfällen hindeuten.

XGBoost

XGBoost hingegen ist bekannt für seine Fähigkeit, nichtlineare Interaktionen zwischen den Merkmalen zu modellieren, welche für die Kreditrisikanalyse entscheidend sind. Indem es auf die Fehler der Basis-1D-CNNs reagiert, optimiert der XGBoost-Algorithmus die Gesamteffizienz des Modells.

Generalisiertes Stacking

Das generalisierte Stacking ermöglicht es, die Vorhersagen der 1D-CNNs zusammenzuführen und als Eingabedaten für das XGBoost-Modell zu verwenden. Durch diese Methodik lernt das XGBoost-Modell von den Residuen oder Fehlern der vorhergesagten Werte der Basis-1D-CNNs und verbessert so die Gesamtgenauigkeit der Modellergebnisse.

Leistungsmessung

Wir verwendeten mehrere Leistungskennzahlen, darunter Präzision, Recall, F1-Score sowie die Area Under Curve (AUC) zur Bewertung des Modellerfolgs. Diese Metriken helfen nicht nur, die Genauigkeit der Vorhersagen zu quantifizieren, sondern auch die Fehlsystemierungskosten zu bewerten. Ein Beispiel für eine solch innovative Metrik ist der H-Measure, der die unterschiedlichen Kosten von Fehlklassifikationen in der Kreditvergabe berücksichtigt.

Fazit

Unser hybrides Modell, das auf den Stärken der 1D-CNNs und XGBoost basiert, stellt einen bedeutenden Fortschritt in der Kreditrisikobewertung dar. Durch die Kombination von tiefen Lerntechniken und Ensemble-Modellen konnten wir eine robuste und präzise Analyse entwickeln, die nicht nur die aktuellen Herausforderungen in der Kreditbewertung angeht, sondern auch zukünftige Anforderungen erfüllt.

Wir sind zuversichtlich, dass diese Ansätze in der Finanztechnologie weiterhin bahnbrechende Veränderungen bringen werden und spannende Perspektiven für die Kreditrisikobewertung bieten.

Für die vollständige Studie und eine detaillierte Analyse unserer Methodik und Ergebnisse, empfehlen wir, die Veröffentlichung zu konsultieren, die nun online verfügbar ist.