• A
  • A
  • A
  • АБB
  • АБB
  • АБB
  • А
  • А
  • А
  • А
  • А
Обычная версия сайта
Бакалавриат 2025/2026

Проектирование и эксплуатация систем машинного обучения

Когда читается: 4-й курс, 1, 2 модуль
Охват аудитории: для своего кампуса
Язык: русский
Кредиты: 5
Контактные часы: 56

Программа дисциплины

Аннотация

Курс «MLOps и ML Systems» посвящён построению и эксплуатации систем машинного обучения в продакшне. Студенты познакомятся с жизненным циклом ML-систем, научатся проектировать пайплайны обработки данных, разрабатывать и деплоить модели, внедрять CI/CD для ML и организовывать мониторинг качества. В курсе уделяется внимание не только алгоритмам, но и инженерным аспектам: инфраструктуре, хранению данных, потоковым системам и интерпретируемости моделей. Для выполнения практических заданий студентам будут предоставлены виртуальные машины MWS Cloud.
Цель освоения дисциплины

Цель освоения дисциплины

  • Цель освоения: дать студентам системное понимание архитектуры ML-систем и инструментов MLOps, научить проектировать и поддерживать end-to-end решения от данных до продакшн-сервисов. По окончании курса студент будет уметь: - описывать жизненный цикл ML-системы и роли участников процесса - работать с современными инструментами хранения и обработки данных (MPP, Kafka, ClickHouse, DBT и др.) - создавать Docker-контейнеры и развертывать ML-сервисы - строить пайплайны с использованием Airflow и CI/CD - организовывать мониторинг моделей и отслеживание сдвигов данных - применять практики интерпретируемости и объяснимости моделей - проектировать масштабируемую ML-инфраструктуру
Планируемые результаты обучения

Планируемые результаты обучения

  • Классифицировать системы машинного обучения
  • Понимание целей курса, use cases, отличия research и production ML
  • Знание принципов MLOps и роли инженерных практик в ML
  • Определение бизнес-целей и требований к ML-системам
  • Умение различать архитектуры ETL/ELT, применять MPP-системы
  • Навыки семплирования, очистки и подготовки обучающих данных
  • Создание контейнеров и деплой ML-сервисов
  • Методы кодирования, борьбы с утечками, инженерии фич
  • Построение и настройка пайплайнов CI/CD
  • Проведение обучения и оценка моделей офлайн и онлайн
  • Навыки работы с Kafka: продюсеры, консьюмеры, интеграция с ML
  • Отличие batch и online прогнозирования, деплой моделей как сервисов
  • Создание DAG-ов, организация исполнения пайплайнов
  • Отслеживание деградации моделей и сдвигов распределений
  • Умение хранить и анализировать большие объёмы данных
  • Настройка CI для данных и моделей, A/B-тестирование в продакшне
  • Построение трансформаций данных через декларативные модели
  • Методы объяснимости и интерпретации решений ML
  • Создание, хранение и переиспользование признаков
  • Конструирование устойчивых и воспроизводимых пайплайнов
  • Архитектура масштабируемых ML-систем и распределённые решения
Содержание учебной дисциплины

Содержание учебной дисциплины

  • Введение в курс и обзор ML-систем
  • MLOps и основы инженерии данных
  • Проектирование систем ML
  • Хранилища данных и системы MP
  • Данные для обучения
  • Docker для ML-приложений
  • Разработка признаков
  • CI/CD в MLOps
  • Разработка модели и её оценка
  • Потоковые данные и Kafka
  • Сервисы прогнозирования моделей
  • Airflow и ML-пайплайны
  • Сдвиги данных и мониторинг
  • ClickHouse для MLOps
  • Непрерывное обучение и тестирование
  • DBT и трансформация данных
  • Интерпретируемость моделей
  • Feature Store
  • Проектирование ML-пайплайнов
  • Масштабируемая инфраструктура ML
Элементы контроля

Элементы контроля

  • неблокирующий Домашнее задание №1
    Задание 1: Установка Docker Задание 2: Создание Docker приложения для ML Задание 3: Docker Compose для упрощения работы
  • неблокирующий Итоговый проект
  • неблокирующий Домашнее задание №2
    Задание 1: Настройка репозитория Задание 2: Настройка CI/CD-пайплайна Задание 3: Автоматизация деплоя модели
  • неблокирующий Домашнее задание №3
    Задание 1: Настройка Apache Airflow Задание 2: Создание DAG для ETL-процесса Задание 3: Мониторинг и отладка
  • неблокирующий Домашнее задание №4
    Задание 1: Установка и настройка ClickHouse Задание 2: Создание таблиц и загрузка данных Задание 3: Выполнение аналитических запросов Задание 4: Настройка производительности Задание 5: Мониторинг и оптимизация
  • неблокирующий Домашнее задание №5
    Задание 1: Установка и настройка DBT Задание 2: Создание моделей данных Задание 3: Тестирование моделей
  • неблокирующий Домашнее задание №6
    Создание продюсеров и консьюмеров Примеры использования Kafka в MLOps
Промежуточная аттестация

Промежуточная аттестация

  • 2025/2026 2nd module
    Формула итоговой оценки = 0.6 × (среднее арифм. ДЗ 1-6) + 0.4 × (итоговый проект)
Список литературы

Список литературы

Рекомендуемая основная литература

  • Шелухин, О. И. Искусственный интеллект и машинное обучение в кибербезопасности : учебно-методическое пособие / О. И. Шелухин, А. В. Осин, Д. И. Раковский. — Москва : МТУСИ, 2022. — 52 с. — Текст : электронный // Лань : электронно-библиотечная система. — URL: https://e.lanbook.com/book/333755 (дата обращения: 00.00.0000). — Режим доступа: для авториз. пользователей.

Рекомендуемая дополнительная литература

  • Машинное обучение без лишних слов - 978-5-4461-1560-0 - Андрей Бурков - 2020 - Санкт-Петербург: Питер - https://ibooks.ru/bookshelf/367991 - 367991 - iBOOKS