• A
  • A
  • A
  • АБB
  • АБB
  • АБB
  • А
  • А
  • А
  • А
  • А
Обычная версия сайта
Магистратура 2025/2026

Разработка и эксплуатация моделей машинного обучения

Когда читается: 1-й курс, 3, 4 модуль
Охват аудитории: для своего кампуса
Язык: русский
Кредиты: 6
Контактные часы: 60

Программа дисциплины

Аннотация

Курс предназначен для разработчиков, желающих углубить знания в области машинного обучения (ML) и освоить ключевые инструменты для работы с ML-системами. Программа охватывает полный цикл разработки: от подготовки данных до развертывания и мониторинга моделей. Студенты познакомятся с методологией CRISP-ML, инструментами управления данными (DVC, Git), базами данных (реляционными, объектными, векторными), а также освоят трекинг экспериментов с MLFlow. Научатся контейнеризировать приложения с помощью Docker и настраивать развертывание в Kubernetes. Особое внимание будет уделено CI/CD процессам и мониторингу ML-систем с использованием Prometheus и Grafana. Практические задания включают настройку хранилищ данных, автоматизацию с Airflow, развертывание моделей, создание REST API и настройку мониторинга. Завершает курс защита проекта и тренировка технических собеседований. При обучении предусмотрен контроль знаний студентов в виде проектной работы и промежуточных контролей, сумма баллов за которые составляет итоговую оценку за курс.
Цель освоения дисциплины

Цель освоения дисциплины

  • Целью освоения дисциплины является формирование у студентов теоретических знаний и практических навыков, необходимых для полного цикла работы с ML-системами: от подготовки данных и создания моделей до их развертывания, мониторинга и автоматизации процессов.
Планируемые результаты обучения

Планируемые результаты обучения

  • Знает, что такое ML эксперимент, как его ставить, какие данные об эксперименте нужно сохранять, чтобы этот эксперимент можно было повторить
  • Знает о типичных инструментах для трекинга, анализа эксперимента таких как MLFlow, KubeFlow + TensorBoard
  • Знает, что такое Docker, Kubernetes, что это за инструменты, для чего используются, какие проблемы решают, базово про их устройство
  • Знает, что такое http запрос, REST API, о том как можно обернуть модель в REST сервис
  • Умеет выполнять базовые команды Docker, как собирать, загружать образы, Dockerfile, docker-compose
  • Умеет делать базовое web приложение на Flask/FastAPI
  • Знает о подходах к обертке модели в сервис посредством готовых инструментов
  • Знает, в чем плюсы и минусы в сравнении с собственной реализацией, области применения
  • Знает о различных форматах представления, экспорта моделей, способов их оптимизации, в том числе на ГПУ
  • Умеет использовать и синхронизировать потоки
  • Знает о том, что такое регулярные расчеты, ETL, потоковая и батчевая обработка данных
  • Знает про инструменты запуска регулярных расчетов (Airflow), обработки потоковых данных (Kafka), их принципы работы
  • Знает про типичные задачи, которые решаются этими инструментами
  • Знает, в чем состоит концепция CI/CD, чем он может быть полезен, какие типичные сценария применения в рабочих процессах
  • Умеет настраивать CI/CD пайплайны в рамках gitlab
  • Знает, зачем нужно настраивать мониторинг своих сервисов, какие обычно метрики отслеживают, в том числе и ML специфичные
  • Знает о базовых концепциях аб тестирования
  • Умеет настраивать дашборды с метриками
  • понимает, на какие процессы раскладывается жизненный цикл ML моделей (crisp-ml) и их роль в обеспечении эффективной работы ML моделей
  • Уметь работать с виртуальными окружениями в контексте python-проекта (venv/poetry/uv).
  • Понимать, что такое контейнеризация и в чем её преимущества для развертывания приложений.
  • Понимать как устроен Docker, основные концепции, может собрать образ, запустить, работать с контейнерами.
  • Понимать принцип работы Docker Compose и его использование для управления мультиконтейнерными приложениями.
  • Понимать концепцию container registry и умеет работать с gitlab container registry.
  • Уметь получать данные из s3 и других баз данных; знать жизненный цикл данных, в каких системах "живут" данные; знать, чем системы управления базами данных различаются и как выбрать подходящую для задачи.
Содержание учебной дисциплины

Содержание учебной дисциплины

  • MLOps: инструменты разработки
  • Работа с данными, хранилища, БД
  • Воспроизводимость в ML
  • Развертка моделей: часть 1
  • Развертка моделей: часть 2
  • Регулярный запуск расчетов, потоковая обработка
  • CI/CD: тестирование, автоматизация операций
  • Мониторинг ML системы
Элементы контроля

Элементы контроля

  • неблокирующий Домашние задания
  • неблокирующий Экзамен
Промежуточная аттестация

Промежуточная аттестация

  • 2025/2026 4th module
    SUM_11_ДОМАШНИХ ЗАДАНИЙ + ЭКЗАМЕН (ЗАЩИТА ПРОЕКТА)
Список литературы

Список литературы

Рекомендуемая основная литература

  • Noah Gift, & Alfredo Deza. (2021). Practical MLOps: Vol. First edition. O’Reilly Media.
  • Бененсон, М. З. Информационные системы, базы и хранилища данных : методические указания / М. З. Бененсон, С. А. Сорокин. — Москва : РТУ МИРЭА, 2024. — 37 с. — Текст : электронный // Лань : электронно-библиотечная система. — URL: https://e.lanbook.com/book/405209 (дата обращения: 00.00.0000). — Режим доступа: для авториз. пользователей.
  • Графовые базы данных : новые возможности для работы со связанными данными, Робинсон, Я., 2016
  • Использование Docker : разработка и внедрение программного обеспечения при помощи технологии контейнеров, Моуэт, Э., 2017

Авторы

  • Крепкер Виктор Алексеевич
  • Сластников Сергей Александрович
  • Смольникова Юлия Валерьевна