Магистратура
2025/2026





Научно-исследовательский семинар "Машинное обучение"
Статус:
Курс обязательный (Искусственный интеллект)
Где читается:
Факультет компьютерных наук
Когда читается:
1-й курс, 2, 3 модуль
Охват аудитории:
для своего кампуса
Преподаватели:
Кантонистова Елена Олеговна
Язык:
русский
Кредиты:
6
Контактные часы:
36
Программа дисциплины
Аннотация
Студенты узнают базовые методы, метрики и концепции машинного обучения, необходимые для решения задач регрессии и классификации. Практическая часть курса реализовывается на языке Python. Курс является необходимым для изучения более продвинутых разделов машинного обучения.
Цель освоения дисциплины
- 1. Знать базовые концепции и определения машинного обучения: виды постановки задач, виды признаков и т.д.
- 2. Работать с табличными данными: загружать, сохранять, модифицировать, агрегировать, работать с пропущенными значениями и т.д.
- 3. Знать и уметь применять методы ближайших соседей.
- 4. Знать принцип работы линейной регрессии и ее модификаций (Lasso, Ridge) и уметь их применять.
- 5. Знать принцип действия работы градиентного спуска.
- 6. Знать принцип работы логистической регрессии и уметь ее применять.
- 7. Знать основные метрики задач регрессии и классификации и уметь выбирать среди них оптимальную в зависимости от постановки задачи.
- 8. Знать метод tf-idf и уметь применять его для текстовых данных.
Планируемые результаты обучения
- MLFlow для экспериментов, Flask для HTTP API, Синхронный и асинхронный ML сервис, Docker для контейнеризации Python-сервиса
- Определяет: - понятие и назначение MLOPS; - как правильно построить цикл обучения и отправки модели в производственную среду; - основные показатели мониторинга моделей машинного обучения.
- Знает и понимает цели и задачи работы над отчетностью по проекту. Знает и понимает основы критического анализа проделанной работы. Знает и понимает требования, предъявляемые к итоговому анализу существа проектной документации для целей подготовки финального отчета и работы над ошибками в рамках реализации и презентации проекта. Способен применить полученные знания, умения и навыки в отношении смоделированной или конкретной жизненной ситуации, предполагающей реализацию проекта.
- Создание рабочих процессов с помощью AirFlow, включая определение задач, настройку расписания выполнения, определение зависимостей и передачу данных между задачами
- Имеют представление о базовых концепциях и определении машинного обучения: виды постановки задач, виды признаков и т.д.
- Работать с табличными данными: загружать, сохранять, модифицировать, агрегировать, работать с пропущенными значениями и т.д.
- Уметь применять методы ближайших соседей.
- Владеть принципами работы линейной регрессии и ее модификаций (Lasso, Ridge) и уметь их применять.
- Знакомы с принципом действия работы градиентного спуска.
- Знакомы с принципом работы логистической регрессии и уметь ее применять.
- Знакомы с основными метриками задач регрессии и классификации и выбирают среди них оптимальную в зависимости от постановки задачи.
- Знакомы с методом tf-idf и применяют его для текстовых данных.
Содержание учебной дисциплины
- Линейные методы регрессии
- Линейные методы классификации
- Снижение размерности данных.
- Решающие деревья и их композиции.
- Интерпретируемость ML-моделей.
- Кластеризация.
- Рекомендательные системы и ранжирование.
- Детекция аномалий и дисбаланс классов.
- Прогнозирование временных рядов.
- Введение MLOps
- AirFlow Часть 1
- AirFlow Часть 2
- MLFlow
- Финальный проект
Элементы контроля
- Домашнее задание 4Решающие деревья. Ансамбли над решающими деревьями. Срок выполнения - 2 недели
- Домашнее задание 5Кластеризация. Срок выполнения - 2 недели.
- Домашнее задание 2Градиентный спуск. Срок выполнения - 2 недели
- Домашнее задание 3Линейная классификация. Классификация текстов. Срок выполнения - 2 недели
- Домашнее задание 6Uplift-моделирование. Срок выполнения - 2 недели.
- Домашнее задание 7Итоговое задание в формате соревнования. Срок выполнения - 2 недели.
- Домашнее задание 1Линейная регрессия, изучение библиотеки sklearn. Срок выполнения - 2 недели
Промежуточная аттестация
- 2025/2026 3rd moduleОкругление(0.6 * ДЗ + 0.25 * онлайн-курс + 0.15 * Э ), где ДЗ — средняя оценка за 6 лучших домашних заданий, Э — оценка за экзамен.
Список литературы
Рекомендуемая основная литература
- Noah Gift, & Alfredo Deza. (2021). Practical MLOps: Vol. First edition. O’Reilly Media.
- Платонов, А. В. Машинное обучение : учебное пособие для вузов / А. В. Платонов. — Москва : Издательство Юрайт, 2023. — 85 с. — (Высшее образование). — ISBN 978-5-534-15561-7. — Текст : электронный // Образовательная платформа Юрайт [сайт]. — URL: https://urait.ru/bcode/520544 (дата обращения: 04.07.2025).
- Харенслак, Б. Apache Airflow и конвейеры обработки данных / Б. Харенслак, Р. Д. де , перевод с английского Д. А. Беликова. — Москва : ДМК Пресс, 2022. — 502 с. — ISBN 978-5-97060-970-5. — Текст : электронный // Лань : электронно-библиотечная система. — URL: https://e.lanbook.com/book/241133 (дата обращения: 00.00.0000). — Режим доступа: для авториз. пользователей.
Рекомендуемая дополнительная литература
- Введение в статистическое обучение с примерами на языке R / Г. Джеймс, Д. Уиттон, Т. Хасти, Р. Тибширани , перевод с английского С. Э. Мастицкого. — Москва : ДМК Пресс, 2017. — 456 с. — ISBN 978-5-97060-495-3. — Текст : электронный // Лань : электронно-библиотечная система. — URL: https://e.lanbook.com/book/93580 (дата обращения: 00.00.0000). — Режим доступа: для авториз. пользователей.
- Криволапов, С. Я., Статистические вычисления на платформе Jupyter Notebook с использованием Python : учебник / С. Я. Криволапов. — Москва : КноРус, 2022. — 431 с. — ISBN 978-5-406-09739-7. — URL: https://book.ru/book/943660 (дата обращения: 04.07.2025). — Текст : электронный.
- Монарх, Р. Машинное обучение с участием человека / Р. Монарх , перевод с английского В. И. Бахура. — Москва : ДМК Пресс, 2022. — 498 с. — ISBN 978-5-97060-934-7. — Текст : электронный // Лань : электронно-библиотечная система. — URL: https://e.lanbook.com/book/241211 (дата обращения: 00.00.0000). — Режим доступа: для авториз. пользователей.