• A
  • A
  • A
  • АБB
  • АБB
  • АБB
  • А
  • А
  • А
  • А
  • А
Обычная версия сайта

Автоматизация создания неправильных вариантов (дистракторов) для банков заданий языкового тестированияAutomation of Distractor (Incorrect Option) Creation for Language Testing Item Banks

Члены комитета:
Клышинский Эдуард Станиславович (Национальный исследовательский университет «Высшая школа экономики» , д-р филол. наук, доцент, председатель комитета), Колмогорова Анастасия Владимировна (Национальный исследовательский университет «Высшая школа экономики» , д-р филол. наук, профессор , член комитета), Котюрова Ирина Аврамовна (Петрозаводский государственный университет, канд. филол. наук, член комитета), Лебедева Мария Юрьевна (Государственный институт русского языка им. А.С. Пушкина, канд. филол. наук, член комитета), Соловьев Валерий Дмитриевич (Казанский (Приволжский) федеральный университет, д-р физ.-мат. наук, профессор, член комитета)
Диссертация принята к предварительному рассмотрению:
12/24/2025
Диссертация принята к защите:
2/4/2026
Дисс. совет:
Совет по филологии
Дата защиты:
4/24/2026
Работа посвящена созданию дистракторов (неправильных вариантов ответа) для вопросов с множественным выбором на владение русским и английским языками. Вопросы с множественным выбором (выбором ответа из нескольких вариантов) являются удобной формой тестирования, поскольку они могут быть легко оценены автоматически. Методы автоматической генерации дистракторов могут позволить снизить затраты на разработку тестовых банков вопросов.В работе представлены подходы к генерации дистракторов для двух типов экзаменационных заданий – заполнения пропуска в тексте и выбора высказывания, соответствующего тексту. Подход к генерации дистракторов для заданий на заполнение пропусков использует словарь, построенный на основе учебного корпуса и ресурсов дистрибутивной семантики, а также классификационную модель машинного обучения, учитывающую векторные представления слов и предложений вместе с частотными данными корпуса. В ходе экспериментов было установлено, что использование классификатора повышает эффективность словарного подхода, а дополнительная ручная разметка дистракторов по приемлемости в контексте способствует более точной классификации.Подход к генерации дистракторов на выбор соответствующих тексту утверждений основан на дообучении больших языковых моделей RuT5 и RuGPT3, а также промптинге больших диалоговых моделей. Для дообучения использовались элементы автоматически переведённого англоязычного набора данных экзаменационных вопросов, а также русскоязычного набора данных тестовых вопросов общего характера. Было установлено, что RuT5 превосходит по качеству генерации другие дообученные модели, а дообучение на переведённых англоязычных данных экзаменационного формата оказывается более эффективным, чем дообучение на русскоязычных данных общего формата. Кроме того, было выявлено, что промптинг превосходит подход на основе дообучения как с точки зрения общепринятых метрик качества генерации, так и с точки зрения большинства предложенных в работе метрик фактического несоответствия и релевантности, а также большинства метрик лексической и синтаксической сложности.
Диссертация [*.pdf, 1.79 Мб] (дата размещения 2/12/2026)
Резюме [*.pdf, 431.14 Кб] (дата размещения 2/12/2026)
Summary [*.pdf, 375.52 Кб] (дата размещения 2/12/2026)

Отзывы
Отзыв научного руководителя
Отзыв члена Комитета
Сведения о результатах защиты:
Комитет по диссертации рекомендовал присудить ученую степень кандидата филологических наук (протокол № 2 от 24.04.2026).