Skip to content

🎯 Credit risk detection - use of PySpark, Python and JupyterLab (Data collection, Cleaning, EDA, Regression, Classification, Statistical tests, and Data Visualization)

Notifications You must be signed in to change notification settings

ZofiaQlt/credit_risk_pyspark

Folders and files

NameName
Last commit message
Last commit date

Latest commit

 

History

35 Commits
 
 
 
 
 
 
 
 

Repository files navigation

Credit risk assessment with PySpark

Capture d’écran 2023-10-08 Ă  20 45 02

LendingClub est une entreprise pionniĂšre dans le secteur des services financiers, dont le siĂšge social est situĂ© Ă  San Francisco, en Californie. Elle a rĂ©alisĂ© plusieurs rĂ©alisations notables dans l'industrie, telles que l'enregistrement de ses offres en tant que titres auprĂšs de la Securities and Exchange Commission (SEC) et l'introduction d'un marchĂ© secondaire pour la nĂ©gociation de prĂȘts. À son apogĂ©e, LendingClub Ă©tait la plus grande plateforme de prĂȘt entre pairs au monde, facilitant des prĂȘts allant de 1 000 Ă  40 000 dollars, gĂ©nĂ©ralement sur une pĂ©riode de trois ans. Les investisseurs pouvaient examiner et sĂ©lectionner des prĂȘts en fonction des dĂ©tails des emprunteurs, de la note de crĂ©dit des prĂȘts et de leur objectif, en percevant des intĂ©rĂȘts sur leurs investissements. LendingClub gĂ©nĂ©rait des revenus grĂące aux frais facturĂ©s aux emprunteurs et aux frais de service perçus auprĂšs des investisseurs.

En 2014, elle a rĂ©alisĂ© la plus grande introduction en bourse technologique aux États-Unis, levant 1 milliard de dollars. Cependant, LendingClub a rencontrĂ© des dĂ©fis en 2016, notamment des difficultĂ©s Ă  attirer des investisseurs, un scandale liĂ© aux prĂȘts, ce qui a entraĂźnĂ© une chute significative de la valeur de ses actions et la dĂ©mission du PDG Renaud Laplanche.

En 2020, LendingClub a acquis Radius Bank et a dĂ©cidĂ© de mettre fin Ă  sa plateforme de prĂȘt entre particuliers.

Introduction

Lending Club a accumulĂ© une vaste base de donnĂ©es concernant les emprunteurs, leurs profils financiers et les rĂ©sultats de leurs demandes de prĂȘt. Le jeu de donnĂ©es utilisĂ© dans ce projet contient des donnĂ©es liĂ©es aux prĂȘts acceptĂ©s, couvrant la pĂ©riode de 2007 au quatriĂšme trimestre de 2018.

Objectif

Le projet vise Ă  dĂ©velopper un modĂšle prĂ©dictif, basĂ© sur les donnĂ©es historiques de remboursement de prĂȘts, pour attribuer une note de risque et prĂ©voir si un individu remboursera intĂ©gralement son prĂȘt, fera dĂ©faut sur le prĂȘt ou aura un paiement en retard. Ce projet utilise des techniques d'apprentissage automatique pour crĂ©er des modĂšles de rĂ©gression et classification, analysant les motifs et les facteurs qui contribuent au comportement de remboursement des prĂȘts, et contribuant ainsi Ă  l'Ă©valuation du risque de crĂ©dit et aux dĂ©cisions de prĂȘt.

Applications business

La thĂ©matique du projet revĂȘt une importance significative dans le domaine financier et bancaire, offrant des informations prĂ©cieuses et des avantages Ă  plusieurs parties prenantes :

Institutions de prĂȘt : Les prĂȘteurs peuvent utiliser le modĂšle prĂ©dictif pour prendre des dĂ©cisions de prĂȘt plus Ă©clairĂ©es et basĂ©es sur les donnĂ©es. En Ă©valuant avec prĂ©cision la solvabilitĂ© des demandeurs, ils peuvent minimiser les risques de dĂ©faut et optimiser leurs stratĂ©gies de prĂȘt. Cela se traduit par de meilleures performances de portefeuille et des pertes financiĂšres rĂ©duites.

Emprunteurs : Les emprunteurs bĂ©nĂ©ficient d'un accĂšs Ă©quitable et Ă©quitable aux opportunitĂ©s de crĂ©dit. Un modĂšle d'Ă©valuation de crĂ©dit robuste garantit que les personnes mĂ©ritantes ne se voient pas refuser injustement des prĂȘts en fonction d'Ă©valuations de risques inexactes. Cela favorise l'inclusion financiĂšre et l'accĂšs au capital pour la croissance personnelle et commerciale.

Gestion des risques : Le projet contribue Ă  une gestion efficace des risques dans l'industrie du prĂȘt. En classant avec prĂ©cision les emprunteurs dans des catĂ©gories de remboursement, il aide les prĂȘteurs Ă  identifier de maniĂšre proactive les dĂ©fauts potentiels et Ă  mettre en Ɠuvre des stratĂ©gies d'attĂ©nuation des risques.

StabilitĂ© financiĂšre : Des pratiques de prĂȘt saines, basĂ©es sur une Ă©valuation prĂ©cise des risques, contribuent Ă  la stabilitĂ© gĂ©nĂ©rale du secteur financier. Éviter les dĂ©fauts excessifs contribue Ă  maintenir la santĂ© des institutions de prĂȘt, ce qui profite finalement Ă  l'Ă©conomie dans son ensemble.

Aide Ă  la dĂ©cision : Le modĂšle prĂ©dictif peut servir d'outil d'aide Ă  la dĂ©cision pour les agents de prĂȘt et les souscripteurs. Il leur fournit des informations basĂ©es sur les donnĂ©es pour complĂ©ter leur expertise, ce qui se traduit par des dĂ©cisions de prĂȘt plus cohĂ©rentes et fiables.

Automatisation et efficacitĂ© : L'automatisation de l'Ă©valuation du risque de crĂ©dit grĂące Ă  des modĂšles d'apprentissage automatique rationalise le processus de prĂȘt. Cela peut entraĂźner des approbations de prĂȘts et des dĂ©caissements plus rapides, amĂ©liorant ainsi l'expĂ©rience globale des clients.

About

🎯 Credit risk detection - use of PySpark, Python and JupyterLab (Data collection, Cleaning, EDA, Regression, Classification, Statistical tests, and Data Visualization)

Topics

Resources

Stars

Watchers

Forks

Releases

No releases published

Packages

No packages published