• A
  • A
  • A
  • АБB
  • АБB
  • АБB
  • А
  • А
  • А
  • А
  • А
Обычная версия сайта
Магистратура 2025/2026

Введение в MLOps

Статус: Курс обязательный (Машинное обучение в цифровом продукте)
Когда читается: 1-й курс, 3 модуль
Охват аудитории: для своего кампуса
Язык: русский
Кредиты: 3
Контактные часы: 40

Программа дисциплины

Аннотация

Курс посвящён изучению принципов и инструментов MLOps — дисциплины, обеспечивающей надёжное, воспроизводимое и масштабируемое функционирование моделей машинного обучения в промышленной среде. В рамках программы рассматривается полный жизненный цикл ML-систем: от управления данными и экспериментами до автоматизации пайплайнов, оркестрации вычислений, развертывания моделей и мониторинга их работы. Студенты изучают практики версионирования данных и моделей, ведения ML-экспериментов (MLflow и аналоги), организации регистров моделей и построения инфраструктуры для контролируемого продвижения моделей по стадиям жизненного цикла. Отдельный блок посвящён проектированию и реализации воспроизводимых ML-пайплайнов с использованием Airflow, Kubeflow и современных инструментов контейнеризации и распределённых вычислений. В процессе обучения разбираются архитектура и компоненты ML-платформ, включая feature store, pipeline-слой, registry и serving-механизмы, а также подходы к тестированию и мониторингу ML-систем в продакшене: от выявления дрейфа данных до анализа системных метрик и диагностики отказов. Практическая часть курса направлена на создание проекта, в рамках которого студент строит экспериментальный ML-пайплайн, отслеживает и сохраняет результаты, регистрирует модель, развертывает её и настраивает основные производственные метрики.
Цель освоения дисциплины

Цель освоения дисциплины

  • Научить пользоваться полным пайплайном инструментов для модели машинного обучения в промышленной среде – от разработки моделей отслеживания экспериментов до деплоя и эксплуатации.
Планируемые результаты обучения

Планируемые результаты обучения

  • Понимать разницу между подходящими проекту типичными пайплайнами создания ML-моделей и процедуру их использования.
  • Владеть навыками и инструментами для разработки автоматизированных пайплайнов для обучения, тестирования и логирования экспериментом ML-моделей (MLFlow).
  • Понимать, как автоматизировать развертывание моделей и вывод в продакшн, использовать инструменты контроля версий данных и моделей.
  • Выполнять необходимые шаги по оптимизации производительности ML-пайплайнов, управлению ресурсами, масштабированию вычислительных ресурсов, распределении нагрузки (Kubernetes, Docker, работа с GPU).
  • Использовать оркестрацию рабочих процессов (Airflow).
  • Понимать, как управлять инфраструктурой контейнеризации и виртуальных сред (интеграция Airflow с Kubernetes и Docker).
  • Может пройти основные этапы, чтобы автоматизировать мониторинг ML-моделей и бизнес-процессов, диагностику сбоев (Grafana).
  • Понимать концепции трекинга экспериментов.
  • Знать основы воспроизводимости экспериментов (фиксирование seed, использование конфигов).
  • Понимать основные сущности MLflow Experiment Tracking (эксперимент, запуск, метрики, параметры, артефакты).
  • Владеть навыками внедерения работы с MLflow в пайплайн обучения модели (создание эксперимента и запуска, логгирование метрик, параметров и артефактов).
  • Уметь работать с UI MLflow (поиск и просмотр эксперимента, информации о запуске и его артефактов, сравнение запусков).
Содержание учебной дисциплины

Содержание учебной дисциплины

  • Введение в MLOps
  • Управление данными. Версионирование данных
  • Автоматизация экспериментов. Ведение ML-экспериментов с MLflow или аналогами
  • Model Registry и управление жизненным циклом
  • Оркестрация и пайплайны ML
  • ML-платформы: обзор и практика
  • Тестирование и валидация ML-систем. Тестирование данных и моделей
  • Мониторинг ML в продакшене. Метрики модели и системы.
  • Основы LLM OPs
Элементы контроля

Элементы контроля

  • неблокирующий Вовлечённость
  • неблокирующий Домашние работы
Промежуточная аттестация

Промежуточная аттестация

  • 2025/2026 3rd module
    0.3 * Вовлечённость + 0.7 * Домашние работы
Список литературы

Список литературы

Рекомендуемая основная литература

  • Introduction to machine learning, Alpaydin, E., 2020
  • Noah Gift, & Alfredo Deza. (2021). Practical MLOps: Vol. First edition. O’Reilly Media.

Рекомендуемая дополнительная литература

  • Криволапов, С. Я., Статистические вычисления на платформе Jupyter Notebook с использованием Python : учебник / С. Я. Криволапов. — Москва : КноРус, 2022. — 431 с. — ISBN 978-5-406-09739-7. — URL: https://book.ru/book/943660 (дата обращения: 04.07.2025). — Текст : электронный.

Авторы

  • Емашева Валерия Анатольевна