Официальный сайт: https://www.teta.mts.ru/
Датасет: Соревнование Alfa Battle 2.0 на платформе Boosters ссылка
Задача от организаторов соревнования: Участникам предлагается оценить вероятность того, что клиент выйдет в дефолт, основываясь на истории потребительского поведения по карточным транзакциям.
Об используемых данных:
- Shape: ~1млн клиентов банка, ~270млн транзакций,
- Size: >3Gb данных.
- Data: 19 фичей по транзакции, в основном категориальные
- История/Последовательность транзакций клиента банка до 12 месяцев (максимум до 9000 транзакций за год).
В рамках группового домашнего задания будет разработан полноценный сервис/демо-стенд, со скоринговой моделью на этом датасете.
Команда slaves:
- Ларюшин Игорь
- Цветов Павел
- Ахмаров Руслан
- Беляев Арсений
Структура репозитория:
- assignment1 - первая часть группового домашего задания с предпроектным исследованием и построением бейзлайнов
- baseline.ipynb - построение бейзлайн моделей, best ROC-AUC=0.78
- eda_validation.ipynb - исследование, мини-EDA, валидация данных
- README.md - описание постановки задачи, мини предпроектное исследование
- assigmnent2 - вторая часть группового домашего задания
- train.ipynb - обучение итоговой скоринговой модели
- scoring - папка с демо-версией работы скоринговой модели