Методы и наборы данных для оценки моделей информационного поиска и обработки естественного языкаMethods and datasets for evaluating information retrieval and natural language processing models
Соискатель:
Члены комитета:
Бурнаев Евгений Владимирович (АНО ВО «Сколковский институт науки и технологий», д.ф.-м.н., председатель комитета), Воронцов Константин Вячеславович (МГУ имени М.В. Ломоносова, д.ф.-м.н., член комитета), Котельников Евгений Вячеславович (АНООВО «ЕУСПб», д.т.н., член комитета), Николенко Сергей Игоревич (РАН, д.ф.-м.н., член комитета), Смирнов Иван Валентинович (РАН, д.т.н., член комитета)
Диссертация принята к предварительному рассмотрению:
12/25/2025
Диссертация принята к защите:
1/29/2026
Дисс. совет:
Совет по компьютерным наукам
Дата защиты:
4/15/2026
Диссертационная работа посвящена методам оценки широкого спектра моделей информационного поиска и обработки естественного языка. В рамках работы предложены методы оценки веб-сниппетов, машинного перевода и распознавания юмора, которые сочетают автоматические подходы и подходы на основе краудсорсинга. Разработаны новые подходы к оценке и повышению качества, удобства и безопасности веб-поиска на основе анализа лога вопросов и информационных потребностей пользователей. Особое внимание уделено оценке качества и устойчивости переноса обучения между наборами данных и языками в задачах ранжирования, вопросно-ответного поиска, распознавания юмора. Разработаны новые подходы к автоматизированному созданию наборов данных для обучения и оценки вопросно-ответных моделей, моделей извлечения информации, моделей распознавания и интерпретации юмора. На основе предложенных методов создан и опубликован ряд новых наборов данных на русском языке. Полученные в работе результаты имеют важное теоретическое и практическое значение и вносят существенный вклад развитие методов информационного поиска и анализа текстов.
Диссертация [*.pdf, 7.78 Мб] (дата размещения 2/10/2026)
Резюме [*.pdf, 1.26 Мб] (дата размещения 2/10/2026)
Summary [*.pdf, 1.23 Мб] (дата размещения 2/10/2026)
Публикации, в которых излагаются основные результаты диссертации
P. Efimov, A. Chertok, L. Boytsov, P. Braslavski SberQuAD – Russian Reading Comprehension Dataset: Description and Analysis (смотреть на сайте журнала)
P. Efimov, L. Boytsov, E. Arslanova, P. Braslavski The Impact of Cross-Lingual Adjustment of Contextual Word Representations on Zero-Shot Transfer (смотреть на сайте журнала)
A. Baranov, V. Kniazhevsky, P.Braslavski You Told Me That Joke Twice: A Systematic Investigation of Transferability and Robustness of Humor Detection Models (смотреть на сайте журнала)
I. Mokrii, L. Boytsov, P. Braslavski A Systematic Evaluation of Transfer Learning and Pseudo-labeling with BERT-based Ranking Models (смотреть на сайте журнала)
A. Bondarenko, E.Shirshakova,M. Driker, M. Hagen, P. Braslavski Misbeliefs and Biases in Health-Related Searches (смотреть на сайте журнала)
V. Blinov, V. Bolotova-Baranova, P. Braslavski Large Dataset and Language Model Fun-Tuning for Humor Recognition (смотреть на сайте журнала)
V. Korablinov, P. Braslavski RuBQ: A Russian Dataset for Question Answering over Wikidata (смотреть на сайте журнала)
I. Rybin, V. Korablinov, P. Efimov, P. Braslavski RuBQ 2.0: An Innovated Russian Question Answering Dataset (смотреть на сайте журнала)
Отзывы
Отзыв члена Комитета
- Смирнов Иван Валентинович (дата размещения 4/1/2026)
- Бурнаев Евгений Владимирович (дата размещения 4/1/2026)
- Котельников Евгений Вячеславович (дата размещения 4/1/2026)
- Николенко Сергей Игоревич (дата размещения 4/2/2026)
- Воронцов Константин Вячеславович (дата размещения 4/1/2026)
Сведения о результатах защиты:
Комитет по диссертации рекомендовал присудить ученую степень доктора наук (протокол № 2 от 15.04.2026). Решением диссертационного совета (протокол № 2 от 30.04.2026) присуждена ученая степень доктора компьютерных наук.
См. на ту же тему
Методы переноса обучения в задачах автоматической обработки текстаКандидатская диссертация
Соискатель: Пугачев Александр Вадимович
Руководитель: Артемова Екатерина Леонидовна
Дата защиты: 7/7/2026
Непредвзятость и оценки неопределённости в задачах анализа текстаКандидатская диссертация
Соискатель: Кузьмин Глеб Юрьевич
Руководитель: Смирнов Иван Валентинович
Дата защиты: 6/19/2026
Методы распознавания и генерации коротких юмористических текстовКандидатская диссертация
Соискатель: Баранов Александр Михайлович
Руководитель: Браславский Павел Исаакович
Дата защиты: 5/21/2026