Data ranking with CatBoost, XGBoost
Задача:
- подготовить и проверить датасет
- натренироавть на любом удобном фреймворке модель, которая будет ранжировать документы по их фичам внутри одной сессии (query_id)
- посчитать метрики ранжирования: ndcg@5
Обе модели дали отличные результаты, в таблице представлены расчеты метрики ndcg@5 для трейна и теста
XGB | CatBoost | |
---|---|---|
train | 0.963186 | 0.955174 |
test | 0.917660 | 0.919568 |