2025/2026



Обработка естественного языка
Статус:
Маго-лего
Кто читает:
Базовая кафедра Яндекс
Где читается:
Факультет компьютерных наук
Когда читается:
1, 2 модуль
Охват аудитории:
для своего кампуса
Язык:
русский
Кредиты:
6
Контактные часы:
56
Программа дисциплины
Аннотация
Обработка естественного языка (NLP) - важная область информатики, искусственного интеллекта и лингвистики, направленная на разработку систем, способных понимать и генерировать естественный язык на человеческом уровне. Современные системы NLP в основном основаны на алгоритмах машинного обучения (ML) и глубокого обучения (DL) и продемонстрировали впечатляющие результаты в широком спектре задач NLP. Этот курс охватывает основные темы NLP, начиная от методов предварительной обработки текста и заканчивая современными нейронными архитектурами.
Цель освоения дисциплины
- В курсе мы постараемся дать вам понять и почувствовать, что происходит в мире. Какие задачи решаются, как это устроено; как некоторые статистические подходы (которые полностью занимали собой предыдущие курсы) получают новую жизнь и новую интерпретацию в нейросетях, а какие постепенно отмирают. Мы покажем, что NLP это не набор пар (задача, решение), а общие идеи, которые проникают в разные задачи и отражают некоторую общую концепцию. Вы также узнаете, что происходит на практике, когда какие подходы более применимы.
Содержание учебной дисциплины
- Обработка естественного языка
- Word Embeddings. Materials: Word Embeddings in the NLP Course | For You
Промежуточная аттестация
- 2025/2026 2nd module0.3 * Домашнее задание + 0.3 * Домашнее задание + 0.4 * Контрольная работа
Список литературы
Рекомендуемая основная литература
- Introduction to natural language processing, Eisenstein, J., 2019
- Kao, A., Poteet S. Natural Language Processing and Text Mining. - Springer, 2007. - ЭБС Books 24x7.
Рекомендуемая дополнительная литература
- The handbook of computational linguistics and natural language processing, , 2013
- Yang Liu, & Meng Zhang. (2018). Neural Network Methods for Natural Language Processing. Computational Linguistics, (1), 193. https://doi.org/10.1162/COLI_r_00312