Репа с материалами курса "Информационный поиск" который читается на ВМК МГУ весной 2024 г.
Тут будут:
- код который показывали на семинарах
- шаблоны ДЗ
- и другие полезные материалы
Как самостотельно запустить код, который показывали на семинарах?
Во-первых, нам понадобится машина с Linux, или любой другой UNIX-подобной системой, в которой:
- будет установлен python, "официальная" версия на которой мы сами проверяли код это python 3.11
- будут доступны шелл (предпочтительно bash) и стандартные утилиты такие как ls и т.д.
Теперь предположим, что мы хотим запустить ноутбук seminars/7-learning-to-rank/catboost_ltr.ipynb из 7-го семинара про машинное обучение ранжированию.
Сначала потребуется создать виртуальное окружение (ВНИМАНИЕ: для каждого семинара это окружение свое!).
Это делается так:
$ cd ДИРЕКТОРИЯ-В-КОТОРУЮ-ВЫ-СКЛОНИРОВАЛИ-РЕПУ-КУРСА
# Создадим папку для виртуальных окружений (если еще создавали)
$ mkdir -p .venvs
# Создадим виртуальное окружение для семинара #7
$ python3 -m venv .venvs/seminar-7
Теперь надо активировать окружение и поставить в него пакеты, перечисленные в файлике ПАПКА-СЕМИНАРА/requirements.txt:
# Активируем окружение
$ source .venvs/seminar-7/bin/activate
# Ставим пакеты
$ pip install -r seminars/7-learning-to-rank/requirements.txt
# Смотрим что поставилось
$ pip list
В результате в окружении должны стать доступны:
- все необходимые для работы питонячие библиотеки, такие как catboost или whoosh
- jupyter
Теперь просто запускаем из окружения jupyter и открываем интересный нам ноутбук в браузере:
# Запускаем jupyter
$ jupyter notebook