Задача состоит в том, что по данным об авторе, его персональному рейтингу, рейтингу журнала, параметрам статьи и другим статистикам определить будущий рейтинг статьи, которую он представит.
- Python 3
- Pandas
- Numpy
- Matplotlib
- Sklearn, catboost
- Использовались модели:
- Линейная регрессия с L1 и L2-регуляризацией
- Дерево решений
- Ансамбли
- Случайный лес
- Градиентный бустинг
- Лучний результат:
- Градиентный бустинг с r2_score равным 0.73
Результат успешный, так как минимальное требование для данной задачи было r2_score = 0.5
Тестовое задание от JetBrains
-
В файле project.yml находится окружение, в котором установлены пакеты Python 3.8.8, sklearn, pandas, numpy
-
Чтобы принять это окружение, необходимо выполнить в anaconda navigator (в текущей директории) команды в файле start.txt
-
Запустите блокнот, выполните все строки
-
Удалите окружение с помощью команд, описанных в файле end.txt