Бакалавриат
2025/2026





Проектирование и эксплуатация систем машинного обучения
Статус:
Курс по выбору (Прикладная математика и информатика)
Кто читает:
Базовая кафедра МТС
Где читается:
Факультет компьютерных наук
Когда читается:
4-й курс, 1, 2 модуль
Охват аудитории:
для своего кампуса
Преподаватели:
Шаланкин Максим Дмитриевич
Язык:
русский
Кредиты:
5
Контактные часы:
56
Программа дисциплины
Аннотация
Курс «MLOps и ML Systems» посвящён построению и эксплуатации систем машинного обучения в продакшне. Студенты познакомятся с жизненным циклом ML-систем, научатся проектировать пайплайны обработки данных, разрабатывать и деплоить модели, внедрять CI/CD для ML и организовывать мониторинг качества. В курсе уделяется внимание не только алгоритмам, но и инженерным аспектам: инфраструктуре, хранению данных, потоковым системам и интерпретируемости моделей.
Для выполнения практических заданий студентам будут предоставлены виртуальные машины MWS Cloud.
Цель освоения дисциплины
- Цель освоения: дать студентам системное понимание архитектуры ML-систем и инструментов MLOps, научить проектировать и поддерживать end-to-end решения от данных до продакшн-сервисов. По окончании курса студент будет уметь: - описывать жизненный цикл ML-системы и роли участников процесса - работать с современными инструментами хранения и обработки данных (MPP, Kafka, ClickHouse, DBT и др.) - создавать Docker-контейнеры и развертывать ML-сервисы - строить пайплайны с использованием Airflow и CI/CD - организовывать мониторинг моделей и отслеживание сдвигов данных - применять практики интерпретируемости и объяснимости моделей - проектировать масштабируемую ML-инфраструктуру
Планируемые результаты обучения
- Классифицировать системы машинного обучения
- Понимание целей курса, use cases, отличия research и production ML
- Знание принципов MLOps и роли инженерных практик в ML
- Определение бизнес-целей и требований к ML-системам
- Умение различать архитектуры ETL/ELT, применять MPP-системы
- Навыки семплирования, очистки и подготовки обучающих данных
- Создание контейнеров и деплой ML-сервисов
- Методы кодирования, борьбы с утечками, инженерии фич
- Построение и настройка пайплайнов CI/CD
- Проведение обучения и оценка моделей офлайн и онлайн
- Навыки работы с Kafka: продюсеры, консьюмеры, интеграция с ML
- Отличие batch и online прогнозирования, деплой моделей как сервисов
- Создание DAG-ов, организация исполнения пайплайнов
- Отслеживание деградации моделей и сдвигов распределений
- Умение хранить и анализировать большие объёмы данных
- Настройка CI для данных и моделей, A/B-тестирование в продакшне
- Построение трансформаций данных через декларативные модели
- Методы объяснимости и интерпретации решений ML
- Создание, хранение и переиспользование признаков
- Конструирование устойчивых и воспроизводимых пайплайнов
- Архитектура масштабируемых ML-систем и распределённые решения
Содержание учебной дисциплины
- Введение в курс и обзор ML-систем
- MLOps и основы инженерии данных
- Проектирование систем ML
- Хранилища данных и системы MP
- Данные для обучения
- Docker для ML-приложений
- Разработка признаков
- CI/CD в MLOps
- Разработка модели и её оценка
- Потоковые данные и Kafka
- Сервисы прогнозирования моделей
- Airflow и ML-пайплайны
- Сдвиги данных и мониторинг
- ClickHouse для MLOps
- Непрерывное обучение и тестирование
- DBT и трансформация данных
- Интерпретируемость моделей
- Feature Store
- Проектирование ML-пайплайнов
- Масштабируемая инфраструктура ML
Элементы контроля
- Домашнее задание №1Задание 1: Установка Docker Задание 2: Создание Docker приложения для ML Задание 3: Docker Compose для упрощения работы
- Итоговый проект
- Домашнее задание №2Задание 1: Настройка репозитория Задание 2: Настройка CI/CD-пайплайна Задание 3: Автоматизация деплоя модели
- Домашнее задание №3Задание 1: Настройка Apache Airflow Задание 2: Создание DAG для ETL-процесса Задание 3: Мониторинг и отладка
- Домашнее задание №4Задание 1: Установка и настройка ClickHouse Задание 2: Создание таблиц и загрузка данных Задание 3: Выполнение аналитических запросов Задание 4: Настройка производительности Задание 5: Мониторинг и оптимизация
- Домашнее задание №5Задание 1: Установка и настройка DBT Задание 2: Создание моделей данных Задание 3: Тестирование моделей
- Домашнее задание №6Создание продюсеров и консьюмеров Примеры использования Kafka в MLOps
Промежуточная аттестация
- 2025/2026 2nd moduleФормула итоговой оценки = 0.6 × (среднее арифм. ДЗ 1-6) + 0.4 × (итоговый проект)
Список литературы
Рекомендуемая основная литература
- Шелухин, О. И. Искусственный интеллект и машинное обучение в кибербезопасности : учебно-методическое пособие / О. И. Шелухин, А. В. Осин, Д. И. Раковский. — Москва : МТУСИ, 2022. — 52 с. — Текст : электронный // Лань : электронно-библиотечная система. — URL: https://e.lanbook.com/book/333755 (дата обращения: 00.00.0000). — Режим доступа: для авториз. пользователей.
Рекомендуемая дополнительная литература
- Машинное обучение без лишних слов - 978-5-4461-1560-0 - Андрей Бурков - 2020 - Санкт-Петербург: Питер - https://ibooks.ru/bookshelf/367991 - 367991 - iBOOKS