Аннотация

Название исследуемой задачи	Байесовский подход к выбору оптимального размера выборки
Тип научной работы	ВКР
Автор	Киселев Никита Сергеевич
Научный руководитель	к.ф.-м.н. Грабовой Андрей Валериевич

Аннотация

При построении модели машинного обучения неизбежно возникает проблема сбора данных для ее обучения. Зачастую, по той или иной причине, естественное требование при этом - минимизировать количество таких данных. В настоящей работе исследуется задача определения достаточного размера выборки. Рассматривается проблема определения достаточного размера выборки без постановки статистической гипотезы о распределении параметров модели.

Предлагаются два подхода к определению достаточного размера выборки по значениям функции правдоподобия на подвыборках с возвращением. Эти подходы основываются на эвристиках о поведении функции правдоподобия при большом количестве объектов в выборке. Предлагаются два подхода к определению достаточного размера выборки на основании близости апостериорных распределений параметров модели на схожих подвыборках. Доказывается корректность представленных подходов при определенных ограничениях на используемую модель. Доказываются теоремы о моментах и полном байесовском прогнозе предельного апостериорного распределения параметров в модели линейной регрессии. Предлагается метод прогнозирования функции правдоподобия в случае недостаточного размера выборки. Проводится вычислительный эксперимент для анализа свойств предложенных методов.

Установка

Чтобы повторить результаты вычислительного эксперимента, рекомендуется установить все необходимые зависимости. Файл requirements.txt находится в директории code. Для установки

Сделайте git clone этого репозитория.
Создайте новое conda окружение и активируйте его.
Запустите pip install -r requirements.txt.

Демонстрация работы

Код со всеми проведенными вычислительными экспериментами здесь.

Name		Name	Last commit message	Last commit date
Latest commit History 27 Commits
code		code
paper		paper
slides		slides
.gitignore		.gitignore
LICENSE		LICENSE
README.md		README.md

Provide feedback

Saved searches

Use saved searches to filter your results more quickly

Repository files navigation

Аннотация

Установка

Демонстрация работы

About

Releases

Packages

Languages

License

intsystems/Kiselev-BS-Thesis

Folders and files

Latest commit

History

Repository files navigation

Аннотация

Установка

Демонстрация работы

About

Topics

Resources

License

Stars

Watchers

Forks

Releases

Packages 0

Languages

Packages