Бакалавриат
2024/2025



Лингвистика для программистов
Статус:
Курс по выбору (Прикладная математика и информатика)
Кто читает:
Школа лингвистики
Когда читается:
3-й курс, 3, 4 модуль
Охват аудитории:
для своего кампуса
Язык:
русский
Программа дисциплины
Аннотация
Задача этого курса – предоставить теоретический бэкграунд студентам, которые планируют связать свою практическую деятельность с языком в том или ином виде. Понимание некоторых аспектов теоретической лингвистики необходимо для того, чтобы изучать поведение языковых моделей, а также для их применения на конкретных задачах и для корректного анализа возникающих ошибок. Ещё более востребованы теоретические представления такого рода при создании диалоговых систем, анализа тональности текста и др. Знания, полученные в ходе этого курса, помогут лучше понимать не только техническую сторону естественной обработки языка, но и теоретическую значимость результатов. Наконец, человеческий язык вообще и разные языки в отдельности устроены очень интересно. Знания о различных способах выражения похожих грамматических и семантических значений, подобно знаниями об алгоритмах и структурах данных, позволяет увидеть нестандартные пути решения прикладных задач.
Цель освоения дисциплины
- уметь анализировать компьютерные методы, в том числе нейросетевые, с точки зрения лингвистической теории
- уметь оценивать качество работы языковых моделей для решения различных лингвистических задач
- разбираться в современных представления о языке применительно к разным его уровням
Планируемые результаты обучения
- уметь отличать лингвистику от других смежных областей
- уметь рассуждать об особенностях отдельных языков
- применять знания из области теоретической лингвистики в NLP
- уметь анализировать фонетические особенности языков
- ориентироваться в основных направлениях лингвистических фреймворков
- уметь пользоваться лингвистическими терминами
Содержание учебной дисциплины
- Фундаментальная и компьютерная лингвистика
- Знание языка моделями
- Жестовые языки. Мультимодальное машинное обучение для распознавания жестовых языков.
- Социолингвистика
- Дискурс
- Полевая лингвистика. Автоматическое распознавание речи на малых языках
- Лингвистические ресурсы: использование корпусных данных для обучения и оценки больших языковых моделей
- Семантика. Полисемия и омонимия. Моделирование семантики системами ИИ
- Синтаксис. Использование UD разметки при машинном обучении
- Моделирование морфологии с помощью правил VS с помощью машинного обучения
- Грамматика и лексика
- Фонетика. Использование частотных коэффициентов для автоматического распознавания речи.
- Почему языки такие разные
- Методы машинного обучения в экспериментальной лингвистике
Промежуточная аттестация
- 2024/2025 4th module0.3 * Домашние задания + 0.3 * Проект + 0.2 * Тесты + 0.2 * Экзамен