Этот репозитарий содержит учебные проекты, созданные в процессе обучения на онлайн-платформе "Яндекс Практикум" по направлению Специалист по Data Science.
Всегда любил искать законмерности и анализировать данные, а в процессе обучения исследование больших наборов данных и прогнозирование еще сильнее увлекло меня, открывая новые горизонты. Я вижу большой потенциал применения машинного обучения для создания нновационных продуктов и услуг, способные улучшить жизнь людей.
👯 Интересуюсь следующими направлениями: беспилотный транспорт, применение ML в энергетике. Углубляю полученные знания в направлении DS/ML
Как со мной связаться:
☎️ +7 927 525-12-40
Содержание моего репозитория:
Название проекта | Навыки и инструменты | Задачи проекта |
---|---|---|
01. Исследование рынка недвижимости | Python, Pandas, Matplotlib, Подготовка данных, Визуализация данных, Исследовательский анализ данных | Используя исторические данные о продажах компьютерных игр, оценки пользователей и экспертов, жанры и платформы, выявить закономерности, определяющие успешность игры. |
02. Исследование продаж компьютерных игр | Python, Pandas, NumPy, Seaborn, Подготовка данных, Визуализация данных, Исследовательский анализ данных, Проверка гипотез | Используя исторические данные о продажах компьютерных игр, оценки пользователей и экспертов, жанры и платформы, выявить закономерности, определяющие успешность игры. |
03. Рекомендации тарифного плана | Python, Pandas, Scikit-Learn, Подготовка данных, Machine Learning, RandomForest, LogisticRegression, DecissionTree | На основании данных о поведении клиентов построить модель с максимально большим значением accuracy для задачи классификации, которая предложит подходящий тариф. |
04. Прогноз оттока клиентов | Python, Pandas, Seaborn, Matplotlib, Scikit-Learn, Подготовка данных, Machine Learning, RandomForest, LogisticRegression, DecissionTree, Балансировка классов, ROC-AUC | На основании данных о поведении клиентов построить модель с максимально большим значением F1 для задачи классификации, которая будет определять клиентов, склонных к оттоку. |
05. Выбор локации для скважины | Python, Pandas, Seaborn, Matplotlib, Scikit-Learn, Подготовка данных, Machine Learning, RandomForest, LogisticRegression, DecissionTree | На основании данных о геологоразведке построить модели прогноза запасов нефтяных скважин для регионов, выбрать регион для разработки с приемлемым порогом риска безубыточности и наиболее перспективными ресурсами. |
06. Восстановление золота из руды | Python, Pandas, Seaborn, Matplotlib, Scikit-Learn, Подготовка данных, Machine Learning, RandomForest, Lasso, DecissionTree, Масштабирование признаков | На основании сырых данных с параметрами добычи и очистки золотоносной руды построить прототип модели для предсказания коэффициента восстановления золота из золотоносной руды с лучшей метрикой sMAPE. |
07. Защита персональных данных | Python, Pandas, Seaborn, Matplotlib, NumPy, Scikit-Learn, Подготовка данных, Machine Learning, LinearRegression, линейная алгебра | Разработать метод преобразования данных, чтобы по ним было сложно восстановить персональную информацию и обосновать корректность его работы. При преобразовании качество моделей машинного обучения не должно ухудшиться. |