Skip to content

Байесовский подход к выбору оптимального размера выборки

License

Notifications You must be signed in to change notification settings

intsystems/Kiselev-BS-Thesis

Folders and files

NameName
Last commit message
Last commit date

Latest commit

 

History

27 Commits
 
 
 
 
 
 
 
 
 
 
 
 

Repository files navigation

Название исследуемой задачи Байесовский подход к выбору оптимального размера выборки
Тип научной работы ВКР
Автор Киселев Никита Сергеевич
Научный руководитель к.ф.-м.н. Грабовой Андрей Валериевич

Аннотация

При построении модели машинного обучения неизбежно возникает проблема сбора данных для ее обучения. Зачастую, по той или иной причине, естественное требование при этом - минимизировать количество таких данных. В настоящей работе исследуется задача определения достаточного размера выборки. Рассматривается проблема определения достаточного размера выборки без постановки статистической гипотезы о распределении параметров модели.

Предлагаются два подхода к определению достаточного размера выборки по значениям функции правдоподобия на подвыборках с возвращением. Эти подходы основываются на эвристиках о поведении функции правдоподобия при большом количестве объектов в выборке. Предлагаются два подхода к определению достаточного размера выборки на основании близости апостериорных распределений параметров модели на схожих подвыборках. Доказывается корректность представленных подходов при определенных ограничениях на используемую модель. Доказываются теоремы о моментах и полном байесовском прогнозе предельного апостериорного распределения параметров в модели линейной регрессии. Предлагается метод прогнозирования функции правдоподобия в случае недостаточного размера выборки. Проводится вычислительный эксперимент для анализа свойств предложенных методов.

Установка

Чтобы повторить результаты вычислительного эксперимента, рекомендуется установить все необходимые зависимости. Файл requirements.txt находится в директории code. Для установки

  • Сделайте git clone этого репозитория.
  • Создайте новое conda окружение и активируйте его.
  • Запустите pip install -r requirements.txt.

Демонстрация работы

Код со всеми проведенными вычислительными экспериментами здесь.

About

Байесовский подход к выбору оптимального размера выборки

Topics

Resources

License

Stars

Watchers

Forks

Releases

No releases published

Packages

No packages published