Track 1: Blow Metal Through Data Science. Develop a model to predict carbon content and iron temperature during the metal blowing process.
ЕВРАЗ предлагает вам окунуться в ключевой процесс производства стали – продувку чугуна.
Разработайте модель, предсказывающую содержание углерода и температуру чугуна во время процесса продувки металла. Самое время расчехлить свой XGBoost и настекать как следует фичей.
А мы вам расскажем, почему задача соревнования очень важна для ЕВРАЗа.
[ 29-31 октября ] Измените работу международной горно-металлургической компании с помощью Data Science. При производстве стали чугун "продувается" кислородом для удаления примесей. Этот процесс идёт в среднем 15-25 минут при температуре около 1600 градусов. За процессом следит машинист дистрибутора, который на основе своего опыта и специальных знаний определяет момент, когда процесс продувки нужно остановить. В процессе продувки металл насыщается кислородом, а его температура увеличивается. Если "передуть" чугун – сгорит больше металла и на выходе будет меньше стали, что приведет к потере прибыли, если "недодуть", то марка стали не будет удовлетворять заданным критериям и нужно будет "додувать", что замедляет производительность цеха. Вам предстоит разработать алгоритм прогнозирования параметров чугуна – что может стать отличным помощником для машиниста и существенно улучшить производство ЕВРАЗа.
Задача - разработать алгоритм предсказания содержание углерода и температуру чугуна.
В этой задаче две подзадачи
- Реализовать алгоритм, предсказывающий содержание углерода и температуры чугуна на момент конца плавки металла
- Задача из реального мира – придумать как обобщить алгоритм из пункта 1 на ситуацию реального производства. В реальном времени мы не знаем, когда наступит конец продувки, а должны определить это сами на основании прогнозируемых параметров чугуна. Что нужно добавить? Как перейти от модельной задачи к задаче из реального мира? Как развить алгоритм так, чтобы это было максимально полезно бизнесу?
Мы разработали модель, которая предсказывает содержания углерода в металле после продувки, а также её температуру.
def metric(answers, user_csv):
delta_c = np.abs(np.array(answers['C']) - np.array(user_csv['C']))
hit_rate_c = np.int64(delta_c < 0.02)
delta_t = np.abs(np.array(answers['TST']) - np.array(user_csv['TST']))
hit_rate_t = np.int64(delta_t < 20)
N = np.size(answers['C'])
return np.sum(hit_rate_c + hit_rate_t) / 2 / N
Лучшие по скору команды презентуют решение судьям конкурса. Среди этих команд победитель определяется по трём критериям, каждый из которых оценивается от 0 до 10 баллов.
- Техническая реализация – скор в контесте и степень технической реализации решения (подзадача 1). Вес критерия: 65% оценки
- Бизнес-ценность – чем ваше решение может помочь машинисту процесса продувки металла (подзадача 2)? Вес критерия: 20% оценки
- Качество проработки и оформление: насколько ваша команда хорошо выступила перед судьями. Вес критерия: 15% оценки