Тип научной работы: Бакалаврский диплом
Автор: Вознюк Анастасия
Научный руководитель: к.ф.-м.н. Грабовой Андрей Валерьевич
Предложить модель для определения границы между частью текста, написанной человеком, и продолжением этой части, сгенерированной языковой моделью. Данная граница может быть в любой части текста, но она проходит по словам.
Дополнительно изучались возможности решать задачу для гипотезы, когда авторы меняются по параграфам.
Предлагается использовать трансформерные архитектуры в качестве решения, так как на данный момент именно они показывают наилучшие результаты
Скрипт ./runs.sh запускает эксперимент для модели DeBERTav3-large
Исходники кода находятся в ./src. Файл main.py содержит основной запуск эксперимента, data_augmentation.py представляет скрипт для аугментации.
На основе Medium.com сгенерированно 10000 документов с помощью модели LLaMA-7b