Методы автоматического вычисления мер близости в задаче кластеризации малых близкородственных идиомов (на материале славянских языков)The Automatic Language Distance Measurement Methods for Small Closely Related Lects Clustering (on the Material of Slavic Languages)
Соискатель:
Афанасьев Илья Андреевич
Руководитель:
Члены комитета:
Старостин Георгий Сергеевич (Национальный исследовательский университет «Высшая школа экономики» , канд. филол. наук, доцент, председатель комитета), Дыбо Анна Владимировна (Институт языкознания РАН, д-р филол. наук, член-корреспондент РАН, член комитета), Митренина Ольга Владимировна (Санкт-Петербургский государственный университет, канд. филол. наук, доцент, член комитета), Мороз Георгий Алексеевич (Национальный исследовательский университет "Высшая школа экономики", канд. филол. наук, член комитета), Соболев Андрей Николаевич (Институт лингвистических исследований РАН, д-р филол. наук, член комитета)
Диссертация принята к предварительному рассмотрению:
4/30/2025
Диссертация принята к защите:
5/28/2025
Дисс. совет:
Совет по филологии
Дата защиты:
9/10/2025
Диссертация посвящёна проблеме измерения языкового расстояния для лектов, представленных малым количеством материала (необработанные корпусы общим объёмом не более 10 000 токенов), на примере древневосточнославянских деловых текстов, с привлечением дополнительных наборов данных: корпусов современных стандартных славянских лектов и малых территориальных восточнославянских лектов; списков слов малых территориальных восточнославянских лектов и лектов Таа; списков фонетических особенностей малых территориальных восточнославянских лектов. Объединение методов, основанных на измерении частотности, мерах сходства строк и векторной репрезентации текстов, предложенное в работе, демонстрирует значения метрик сходства между лектами, подтверждаемые введёнными ранее в научный оборот методами сравнительно-исторического языкознания, такими как сравнение списков базовой лексики при помощи мер сходства строк, использующих фонетическую информацию. При помощи введённых в работе техник предварительной обработки данных увеличивается эффективность разработанного метода автоматического подсчёта расстояния между лектами, представленными малыми необработанными корпусами, а также повышается интерпретируемость диалектометрических результатов. Показано, что перекрёстная оценка улучшает качество интерпретации результатов метода подсчёта языкового расстояния. Предложенная в работе кластеризация отражает генетическое разделение между новгородскими лектами с одной стороны, и смоленскими и полоцкими с другой: выявлено, что деловые древневосточнославянские грамоты конца XII – начала XIV вв., происходящие из Смоленска, Полоцка и Новгорода, демонстрируют следы формирования двух клад славянского континуума: древненовгородской (тексты из Новгорода) и протобелорусской (тексты из Смоленска и Полоцка). Однако на момент конца XII – начала XIV вв. данные черты сформированы не до конца, и в текстах, составляющих основной набор данных, часто замаскированы языковыми особенностями надрегионального койне.
Диссертация [*.pdf, 2.82 Мб] (дата размещения 6/19/2025)
Резюме [*.pdf, 589.65 Кб] (дата размещения 6/19/2025)
Summary [*.pdf, 580.52 Кб] (дата размещения 6/19/2025)
Публикации, в которых излагаются основные результаты диссертации
Language distance: the evolution of an idea (в печати)
Отзывы
Отзыв научного руководителя
- Ляшевская О.Н. (дата размещения 4/30/2025)
Отзыв ведущей организации
- Дыбо А.В. (дата размещения 9/9/2025)
- Старостин Г.С. (дата размещения 9/9/2025)
- Мороз Г.А. (дата размещения 9/9/2025)
- Соболев А.Н. (дата размещения 9/9/2025)
- Митренина О.В. (дата размещения 9/9/2025)
Сведения о результатах защиты:
Комитет по диссертации рекомендовал присудить ученую степень кандидата филологических наук (протокол № 2 от 10.09.2025). Решением диссертационного совета (протокол №9 от 12.09.2025) присуждена ученая степень кандидата филологических наук.
См. на ту же тему
Автоматический анализ прагматики и дискурса в диалогах на повседневные темыКандидатская диссертация
Соискатель: Остякова Лидия Николаевна
Руководитель: Толдова Светлана Юрьевна
Дата защиты: 10/27/2025
Синтаксис конструкций спецификации в типологическом аспектеКандидатская диссертация
Соискатель: Логвинова Наталья Николаевна
Руководитель: Холодилова Мария Александровна
Дата защиты: 5/23/2025
Бенефактивные конструкции в современной японской речи: корпусное исследованиеКандидатская диссертация
Соискатель: Соломкина Наталия Алексеевна
Руководитель: Подлесская Вера Исааковна
Дата защиты: 5/16/2023