https://www.kaggle.com/c/ozon-masters-ds-contest-2021/overview
Требуется по описанию компьютерной игры предсказать победителя. Игра ведётся в режиме 1 на 1 двумя игроками, они названы игрок 1 и игрок 2, но этот порядок не даёт никакому из игроков преимущества (это не пошаговая игра, а игра в режиме реального времени, поэтому нет и преимущества первого хода). Игроки управляют юнитами (которые игроки выбирают, прокачивают перед сражением). В армии каждого игрока 8 разных юнитов, состав армии фиксирован на время сражения, но его можно менять перед сражением. Исход игры зависит от случая, мастерства игроков и способности юнитов взаимодействовать и уничтожать юниты противника.
Нет "самого сильного юнита", они организованы по принципу "камень-ножницы-бумага". Например, дракон легко убивает рыцаря, лучник - дракона, а рыцарь - лучника. Аналогично, нет самой сильной армии. Однако, армия может быть составлена удачно и неудачно (удачной считается сбалансированная: когда для любого юнита соперника найдётся более сильный юнит).
Обращаем внимание, что в публичном лидерборде всего 1% тестовой выборки (он нужен лишь для контроля корректности посылки). Правильно организуйте локальный контроль! Данных для локального контроля достаточно.
Для оценки используется logloss.
Описание данных
- train.csv - обучающая выборка с целевым признаком
- test.csv - тестовая без целевого
- sample_submission.csv - пример решения
Названия признаков
- X0 - режим (тренировка, бой, бой на чемпионате и т.п.)
- X1 - игрок 1 (id)
- X2 - рейтинг игрока 1 до игры (порядковый)
- X3 - игрок 2 (id)
- X4 - рейтинг игрока 2 до игры (порядковый)
- X5 - юнит 1 игрока 1 (ниже описание армий игроков, перечислены id юнитов, описание юнитов не даётся)
- X6 - юнит 2 игрока 1
...
- X12 - юнит 8 игрока 1
- X13 - юнит 1 игрока 2
...
- X20 - юнит 8 игрока 2
- X21 - время игры (порядковый)
Все признаки, которые не помечены как порядковые – категориальные. Целевое значений = 1, если выиграл первый игрок, иначе = 0.
- Задача решается индивидуально.
- Использование ликов в данных допустимо.
- Запрещается делиться своими находками (ликов или особенностей данных), а также кодом с другими участниками.
- Ограничений по ресурсам нет.
- Если вы используете ноутбуки Kaggle, оставляйте их приватными.
- Форумом Kaggle тоже нельзя пользоваться для обсуждения. Если у вас есть вопросы, их нужно направить организаторам. Ответы на популярные вопросы или другие новости этого соревнования будут освещаться в канале Telegram.
- В день дается две попытки. Вы видите расчет метрики на публичной части датасета, а итоги будут подводиться по приватной части датасета, которая откроется через некоторое время после дедлайна.
- Название команды. Несмотря на то, что вы работаете над решеним в одиночку, нужно задать название команды из одного человека в пункте меню Team на главной странице соревнования. Впишите туда ваше ФИО, например: Сергеева Лидия Николаевна.
- После дедлайна и перед подведением итогов, мы попросим вас прислать ваши решения для проверки на воспроизводимость (см. ниже) и плагиат.
Обращаем внимание, что в публичном лидерборде всего 1% тестовой выборки (он нужен лишь для контроля корректности посылки). Правильно организуйте локальный контроль! Данных для локального контроля достаточно. Решения
Вы должны загрузить ваше решение через бот @ozonm_comp_bot. Решение может быть в виде запускаемой программы или jupyter-ноутбука. В решении обязательно должно быть описание вашего решения - в комментариях в тексте программы в самом начале, или в markdown-ячейке ноутбука. Перед загрузкой удалите чрезмерный текст из ячеек вывода.
Займитесь решением пораньше. Kaggle не идеальная платформа, и бывают сбои. Например, вы загружаете решение, но оно не принимается, а ваша попытка сгорает из-за какого-то сбоя. Мы не сможем вам помочь в такой ситуации, только посочувствовать. У нас не будет возможности восстановить вам попытку, или залить за вас ваш файл submission.csv. Поэтому не откладывайте на последние дни.