• A
  • A
  • A
  • АБB
  • АБB
  • АБB
  • А
  • А
  • А
  • А
  • А
Обычная версия сайта

Применение глубоких нейросетевых моделей, учитывающих структурную лингвистическую информацию, в прикладных задачах анализа текстовых данныхApplication of Deep Learning Models Using Structural Linguistic Information in Applied NLP Tasks

Члены комитета:
Игнатов Дмитрий Игоревич (НИУ ВШЭ, к.т.н., председатель комитета), Алимова Ильсеяр Салимовна (Сколковский институт науки и технологий, к.т.н., член комитета), Никишина Ирина Александровна (Университет Гамбурга, к.т.н., член комитета), Смирнов Иван Валентинович (Федеральный исследовательский центр «Информатика и управление» РАН, д.т.н., член комитета), Шелманов Артем Олегович (Университет искусственного интеллекта имени Мохамеда бен Заида (Объединенные Арабские Эмираты), к.т.н., член комитета)
Диссертация принята к предварительному рассмотрению:
3/27/2025
Диссертация принята к защите:
4/24/2025
Дисс. совет:
Совет по компьютерным наукам
Дата защиты:
6/27/2025
Диссертация исследует методы интеграции лингвистических структур, в частности, дискурсивных, в современные модели обработки естественного языка (SOTA), такие как рекурсивные нейронные сети и Трансформеры. Представлены новые архитектуры RSTRecNN и DSNDM, эффективно кодирующие дискурсивные деревья. Эти модели демонстрируют высокие результаты в задачах анализа аргументации, тональности текстов, проверки фактов и ранжирования в вопросно-ответных системах. Для задачи генерации текста (NLG) предложен подход к оценке качества дискурсивной структуры, выявивший недостатки существующих моделей. Представлены методы с использованием планирования, улучшающие дискурсивную структуру при генерации как в повествовательных текстах, так и в диалогах. Также предложена модификация архитектуры BART, учитывающая больше типов лингвистической информации, что повышает качество генерации и интерпретируемость результатов. В работе также представлена демонстрационная система, решающая задачу обсуждения научных статей, не имеющая открытых аналогов. Наконец, предложена модификация Трансформера, интегрирующая дискурсивные признаки, которая превосходит существующие подходы в детекции манипулятивного контента. В ходе исследования были собраны и опубликованы в открытом доступе несколько новых наборов данных. В целом, работа подчеркивает важность учета лингвистической информации для повышения качества современных моделей обработки естественного языка и открывает перспективные направления для их дальнейшего развития в различных NLP-задачах.
Диссертация [*.pdf, 6.12 Мб] (дата размещения 4/26/2025)
Резюме [*.pdf, 1.07 Мб] (дата размещения 4/26/2025)
Summary [*.pdf, 1.09 Мб] (дата размещения 4/26/2025)

Публикации, в которых излагаются основные результаты диссертации

Chernyavskiy A., Ilvovsky D. Recursive Neural Text Classification using Discourse Tree Structure for Argumentation Mining and Sentiment Analysis Tasks (смотреть на сайте журнала)
Chernyavskiy A. Improving Text Generation via Neural Discourse Planning (смотреть на сайте журнала)


Отзывы
Отзыв научного руководителя
Отзыв члена Комитета
Сведения о результатах защиты:
Комитет по диссертации рекомендовал присудить ученую степень кандидата наук (протокол № 2 от 27.06.2025).