• A
  • A
  • A
  • АБB
  • АБB
  • АБB
  • А
  • А
  • А
  • А
  • А
Обычная версия сайта
Бакалавриат 2024/2025

Лингвистика для программистов

Когда читается: 3-й курс, 3, 4 модуль
Охват аудитории: для своего кампуса
Язык: русский

Программа дисциплины

Аннотация

Задача этого курса – предоставить теоретический бэкграунд студентам, которые планируют связать свою практическую деятельность с языком в том или ином виде. Понимание некоторых аспектов теоретической лингвистики необходимо для того, чтобы изучать поведение языковых моделей, а также для их применения на конкретных задачах и для корректного анализа возникающих ошибок. Ещё более востребованы теоретические представления такого рода при создании диалоговых систем, анализа тональности текста и др. Знания, полученные в ходе этого курса, помогут лучше понимать не только техническую сторону естественной обработки языка, но и теоретическую значимость результатов. Наконец, человеческий язык вообще и разные языки в отдельности устроены очень интересно. Знания о различных способах выражения похожих грамматических и семантических значений, подобно знаниями об алгоритмах и структурах данных, позволяет увидеть нестандартные пути решения прикладных задач.
Цель освоения дисциплины

Цель освоения дисциплины

  • уметь анализировать компьютерные методы, в том числе нейросетевые, с точки зрения лингвистической теории
  • уметь оценивать качество работы языковых моделей для решения различных лингвистических задач
  • разбираться в современных представления о языке применительно к разным его уровням
Планируемые результаты обучения

Планируемые результаты обучения

  • уметь отличать лингвистику от других смежных областей
  • уметь рассуждать об особенностях отдельных языков
  • применять знания из области теоретической лингвистики в NLP
  • уметь анализировать фонетические особенности языков
  • ориентироваться в основных направлениях лингвистических фреймворков
  • уметь пользоваться лингвистическими терминами
Содержание учебной дисциплины

Содержание учебной дисциплины

  • Фундаментальная и компьютерная лингвистика
  • Знание языка моделями
  • Жестовые языки. Мультимодальное машинное обучение для распознавания жестовых языков.
  • Социолингвистика
  • Дискурс
  • Полевая лингвистика. Автоматическое распознавание речи на малых языках
  • Лингвистические ресурсы: использование корпусных данных для обучения и оценки больших языковых моделей
  • Семантика. Полисемия и омонимия. Моделирование семантики системами ИИ
  • Синтаксис. Использование UD разметки при машинном обучении
  • Моделирование морфологии с помощью правил VS с помощью машинного обучения
  • Грамматика и лексика
  • Фонетика. Использование частотных коэффициентов для автоматического распознавания речи.
  • Почему языки такие разные
  • Методы машинного обучения в экспериментальной лингвистике
Элементы контроля

Элементы контроля

  • неблокирующий Тесты
  • неблокирующий Проект
  • неблокирующий Экзамен
  • неблокирующий Домашние задания
Промежуточная аттестация

Промежуточная аттестация

  • 2024/2025 4th module
    0.3 * Домашние задания + 0.3 * Проект + 0.2 * Тесты + 0.2 * Экзамен
Список литературы

Список литературы

Рекомендуемая основная литература

  • A concise introduction to linguistics, Rowe, B. M., 2018

Рекомендуемая дополнительная литература

  • Speech and language processing : an introduction to natural language processing, computational linguistics, and speech recognition, Jurafsky, D., 2009

Авторы

  • Дьячкова Анна Евгеньевна
  • Казакова Татьяна Борисовна
  • Бузанов Антон Олегович