2025/2026




Основы искусственного интеллекта для анализа текстов
Статус:
Дисциплина общефакультетского пула
Где читается:
Факультет компьютерных наук
Когда читается:
3, 4 модуль
Охват аудитории:
для своего кампуса
Язык:
русский
Кредиты:
3
Контактные часы:
20
Программа дисциплины
Аннотация
Дисциплина «Основы искусственного интеллекта для анализа текстов» формирует у студентов практические навыки применения методов машинного обучения и обработки естественного языка на языке программирования Python. Особенностью курса является индивидуальный проектный трек: каждый студент разрабатывает собственный исследовательский проект в области анализа текстовых или иных данных, сопровождаемый консультациями с преподавателем.
Цель освоения дисциплины
- Целью освоения дисциплины является формирование у студентов теоретических знаний и практических компетенций в области анализа данных и обработки естественного языка, необходимых для проведения самостоятельных исследований с применением инструментов ML и искусственного интеллекта в востоковедческом контексте.
Планируемые результаты обучения
- Результатом освоения данного курса является умение студентов применять анализ данных для решения различных задач в рамках реального проекта.
- Студенты изучают основные статистические методы анализа данных (корреляция, линейная и логистическая регрессия);
- Студенты рассмотривают ключевые методы обработки естественного языка (токенизация, лемматизация, стемминг, построение n-грамм, удаление стоп-слов);
- Студенты изучают принципы тематического моделирования и анализа тональности текстов.
- Студенты учатся реализовывать методы анализа данных и текста на языке Python.
- Студенты учатся формулировать количественную исследовательскую задачу и выбирать адекватный инструментарий и методологию для её решения;
- Студенты интерпретируют результаты количественного и текстового анализа применительно к востоковедческому материалу.
- Студенты получают навыки работы с актуальными Python-библиотеками для анализа данных и текста (pandas, scikit-learn, nltk, pymorphy3 и т.д.);
- Студенты получают опыт в самостоятельной разработке исследовательского проекта от постановки задачи до представления результатов.
Элементы контроля
- Домашнее задание
- Мини-проект-
- Оценка за 2 модуль курса «Анализ данных на Python»
- Тесты из онлайн-курса
Промежуточная аттестация
- 2025/2026 4th module0.2 * Домашнее задание + 0.2 * Мини-проект + 0.5 * Оценка за 2 модуль курса «Анализ данных на Python» + 0.1 * Тесты из онлайн-курса
Список литературы
Рекомендуемая основная литература
- 9781491912140 - Vanderplas, Jacob T. - Python Data Science Handbook : Essential Tools for Working with Data - 2016 - O'Reilly Media - https://search.ebscohost.com/login.aspx?direct=true&db=nlebk&AN=1425081 - nlebk - 1425081
Рекомендуемая дополнительная литература
- Прикладной анализ текстовых данных на Python. Машинное обучение и создание приложений обработки естественного языка - 978-5-4461-1153-4 - Бенджамин Бенгфорт, Ребекка Билбро, Тони Охеда - 2021 - Санкт-Петербург: Питер - https://ibooks.ru/products/365298 - 365298 - iBOOKS