Credit Risk Classification for Banking Systems

Project Overview

Developed a credit risk classification model using a dataset with mixed categorical and numerical features, incorporating a cost matrix for the business-specific outcomes.

Key Steps

Data Exploration and Visualization
- Explored data to understand distributions, correlations, and patterns.
- Visualized data using plots and charts to identify trends and anomalies.
Data Preprocessing
- Detected outliers and handled corrupted data.
- Performed statistical analysis.
- Applied minority class upsampling to address imbalance.
Dimensionality Reduction
- Utilized Factor Analysis of Mixed Data (FAMD) to reduce feature complexity from 58 to 10, while maintaining model performance (F1-Score = 8.5).
Model Training and Optimization
- Trained and optimized various algorithms:
  - XGBoost
  - RandomForest
  - KNN
  - Gaussian Naive Bayes
  - LightGBM
- Used grid search for hyperparameter tuning.
- Evaluated model generalization using k-fold cross-validation.
- Monitored memory and time usage across classifiers.

Summary

This project successfully developed a robust and efficient credit risk classification model tailored for banking applications, ensuring high performance and alignment with business-specific outcomes.

Name		Name	Last commit message	Last commit date
Latest commit History 3 Commits
.gitattributes		.gitattributes
LICENSE		LICENSE
pipeline.ipynb		pipeline.ipynb
readme.md		readme.md

Provide feedback

Saved searches

Use saved searches to filter your results more quickly

Repository files navigation

Credit Risk Classification for Banking Systems

Project Overview

Key Steps

Summary

About

Releases

Packages

Languages

License

MohammadDallash/Credit-Risk-Classification-for-banking-systems

Folders and files

Latest commit

History

Repository files navigation

Credit Risk Classification for Banking Systems

Project Overview

Key Steps

Summary

About

Topics

Resources

License

Stars

Watchers

Forks

Releases

Packages 0

Languages

Packages