• A
  • A
  • A
  • АБB
  • АБB
  • АБB
  • А
  • А
  • А
  • А
  • А
Обычная версия сайта

Методы автоматического вычисления мер близости в задаче кластеризации малых близкородственных идиомов (на материале славянских языков)The Automatic Language Distance Measurement Methods for Small Closely Related Lects Clustering (on the Material of Slavic Languages)

Соискатель:
Афанасьев Илья Андреевич
Члены комитета:
Старостин Георгий Сергеевич (Национальный исследовательский университет «Высшая школа экономики» , канд. филол. наук, доцент, председатель комитета), Дыбо Анна Владимировна (Институт языкознания РАН, д-р филол. наук, член-корреспондент РАН, член комитета), Митренина Ольга Владимировна (Санкт-Петербургский государственный университет, канд. филол. наук, доцент, член комитета), Мороз Георгий Алексеевич (Национальный исследовательский университет "Высшая школа экономики", канд. филол. наук, член комитета), Соболев Андрей Николаевич (Институт лингвистических исследований РАН, д-р филол. наук, член комитета)
Диссертация принята к предварительному рассмотрению:
4/30/2025
Диссертация принята к защите:
5/28/2025
Дисс. совет:
Совет по филологии
Дата защиты:
9/10/2025
Диссертация посвящёна проблеме измерения языкового расстояния для лектов, представленных малым количеством материала (необработанные корпусы общим объёмом не более 10 000 токенов), на примере древневосточнославянских деловых текстов, с привлечением дополнительных наборов данных: корпусов современных стандартных славянских лектов и малых территориальных восточнославянских лектов; списков слов малых территориальных восточнославянских лектов и лектов Таа; списков фонетических особенностей  малых территориальных восточнославянских лектов.  Объединение методов, основанных на измерении частотности, мерах сходства строк и векторной репрезентации текстов, предложенное в работе, демонстрирует значения метрик сходства между лектами, подтверждаемые введёнными ранее в научный оборот методами сравнительно-исторического языкознания, такими как сравнение списков базовой лексики при помощи мер сходства строк, использующих фонетическую информацию. При помощи введённых в работе техник предварительной обработки данных увеличивается эффективность разработанного метода автоматического подсчёта расстояния между лектами, представленными малыми необработанными корпусами, а также повышается интерпретируемость диалектометрических результатов. Показано, что перекрёстная оценка улучшает качество интерпретации результатов метода подсчёта языкового расстояния. Предложенная в работе кластеризация отражает генетическое разделение между новгородскими лектами с одной стороны, и смоленскими и полоцкими с другой: выявлено, что деловые древневосточнославянские грамоты конца XII – начала XIV вв., происходящие из Смоленска, Полоцка и Новгорода, демонстрируют следы формирования двух клад славянского континуума: древненовгородской (тексты из Новгорода) и протобелорусской (тексты из Смоленска и Полоцка). Однако на момент конца XII – начала XIV вв. данные черты сформированы не до конца, и в текстах, составляющих основной набор данных, часто замаскированы языковыми особенностями надрегионального койне.
Диссертация [*.pdf, 2.82 Мб] (дата размещения 6/19/2025)
Резюме [*.pdf, 589.65 Кб] (дата размещения 6/19/2025)
Summary [*.pdf, 580.52 Кб] (дата размещения 6/19/2025)

Публикации, в которых излагаются основные результаты диссертации

Language distance: the evolution of an idea (в печати)


Отзывы
Отзыв научного руководителя
Отзыв ведущей организации
Сведения о результатах защиты:
Комитет по диссертации рекомендовал присудить ученую степень кандидата филологических наук (протокол № 2 от 10.09.2025). Решением диссертационного совета (протокол №9 от 12.09.2025) присуждена ученая степень кандидата филологических наук.
См. на ту же тему

Автоматический анализ прагматики и дискурса в диалогах на повседневные темыКандидатская диссертация

Соискатель: Остякова Лидия Николаевна
Руководитель: Толдова Светлана Юрьевна
Дата защиты: 10/27/2025

Синтаксис конструкций спецификации в типологическом аспектеКандидатская диссертация

Соискатель: Логвинова Наталья Николаевна
Руководитель: Холодилова Мария Александровна
Дата защиты: 5/23/2025

Бенефактивные конструкции в современной японской речи: корпусное исследованиеКандидатская диссертация

Соискатель: Соломкина Наталия Алексеевна
Руководитель: Подлесская Вера Исааковна
Дата защиты: 5/16/2023