Автоматизация создания неправильных вариантов (дистракторов) для банков заданий языкового тестированияAutomation of Distractor (Incorrect Option) Creation for Language Testing Item Banks

Соискатель:

Руководитель:

Ляшевская Ольга Николаевна (др. работы под рук-вом)

Члены комитета:

Клышинский Эдуард Станиславович (Национальный исследовательский университет «Высшая школа экономики» , д-р филол. наук, доцент, председатель комитета), Колмогорова Анастасия Владимировна (Национальный исследовательский университет «Высшая школа экономики» , д-р филол. наук, профессор , член комитета), Котюрова Ирина Аврамовна (Петрозаводский государственный университет, канд. филол. наук, член комитета), Лебедева Мария Юрьевна (Государственный институт русского языка им. А.С. Пушкина, канд. филол. наук, член комитета), Соловьев Валерий Дмитриевич (Казанский (Приволжский) федеральный университет, д-р физ.-мат. наук, профессор, член комитета)

Диссертация принята к предварительному рассмотрению:

12/24/2025

Диссертация принята к защите:

2/4/2026

Дисс. совет:

Совет по филологии

Дата защиты:

4/24/2026

Работа посвящена созданию дистракторов (неправильных вариантов ответа) для вопросов с множественным выбором на владение русским и английским языками. Вопросы с множественным выбором (выбором ответа из нескольких вариантов) являются удобной формой тестирования, поскольку они могут быть легко оценены автоматически. Методы автоматической генерации дистракторов могут позволить снизить затраты на разработку тестовых банков вопросов.В работе представлены подходы к генерации дистракторов для двух типов экзаменационных заданий – заполнения пропуска в тексте и выбора высказывания, соответствующего тексту. Подход к генерации дистракторов для заданий на заполнение пропусков использует словарь, построенный на основе учебного корпуса и ресурсов дистрибутивной семантики, а также классификационную модель машинного обучения, учитывающую векторные представления слов и предложений вместе с частотными данными корпуса. В ходе экспериментов было установлено, что использование классификатора повышает эффективность словарного подхода, а дополнительная ручная разметка дистракторов по приемлемости в контексте способствует более точной классификации.Подход к генерации дистракторов на выбор соответствующих тексту утверждений основан на дообучении больших языковых моделей RuT5 и RuGPT3, а также промптинге больших диалоговых моделей. Для дообучения использовались элементы автоматически переведённого англоязычного набора данных экзаменационных вопросов, а также русскоязычного набора данных тестовых вопросов общего характера. Было установлено, что RuT5 превосходит по качеству генерации другие дообученные модели, а дообучение на переведённых англоязычных данных экзаменационного формата оказывается более эффективным, чем дообучение на русскоязычных данных общего формата. Кроме того, было выявлено, что промптинг превосходит подход на основе дообучения как с точки зрения общепринятых метрик качества генерации, так и с точки зрения большинства предложенных в работе метрик фактического несоответствия и релевантности, а также большинства метрик лексической и синтаксической сложности.

Диссертация [*.pdf, 1.79 Мб] (дата размещения 2/12/2026)

Резюме [*.pdf, 431.14 Кб] (дата размещения 2/12/2026)

Summary [*.pdf, 375.52 Кб] (дата размещения 2/12/2026)

Публикации, в которых излагаются основные результаты диссертации

Wrong Answers Only: Distractor Generation for Russian Reading Comprehension Questions Using a Translated Dataset

Distractor Generation for Lexical Questions Using Learner Corpus Data

Jokingbird: Funny Headline Generation for News

Отзывы

Отзыв научного руководителя

Ляшевская О.Н. (дата размещения 12/24/2025)

Отзыв члена Комитета

Клышинский Э.С. (дата размещения 4/23/2026)
Соловьев В.Д. (дата размещения 4/23/2026)
Колмогорова А.В. (дата размещения 4/23/2026)
Котюрова И.А. (дата размещения 4/23/2026)
Лебедева М.Ю. (дата размещения 4/23/2026)

Сведения о результатах защиты:

Комитет по диссертации рекомендовал присудить ученую степень кандидата филологических наук (протокол № 2 от 24.04.2026). Решением диссертационного совета (протокол №5 от 27.05.2026) присуждена ученая степень кандидата филологических наук.

Ключевые слова:

автоматическая генерация дистракторов, большая языковая модель, вопросы на заполнение пропусков, вопросы с множественным выбором, компьютерное обучение языку, машинное обучение, перевод наборов данных, понимание прочитанного, стандартизированные языковые тесты, учебный корпус текстов

См. на ту же тему

Мультимодальный анализ цифровых профилей студентов в социальных сетях для задач образовательной аналитикиКандидатская диссертация

Соискатель: Горшков Сергей Сергеевич
Руководитель: Игнатов Дмитрий Игоревич

Методы машинного обучения в задачах популяционной геномикиКандидатская диссертация

Соискатель: Хомутов Евгений Васильевич
Руководитель: Щур Владимир Львович

Методы и алгоритмы ускорения проектирования цифровых схем с использованием машинного обученияКандидатская диссертация

Соискатель: Зунин Владимир Викторович
Руководитель: Романов Александр Юрьевич
Дата защиты: 9/17/2026