• A
  • A
  • A
  • АБB
  • АБB
  • АБB
  • А
  • А
  • А
  • А
  • А
Обычная версия сайта
Магистратура 2024/2025

Научно-исследовательский семинар "Введение в MLOps"

Статус: Курс по выбору (Искусственный интеллект)
Направление: 01.04.02. Прикладная математика и информатика
Когда читается: 2-й курс, 1 модуль
Формат изучения: без онлайн-курса
Охват аудитории: для своего кампуса
Прогр. обучения: Машинное обучение и высоконагруженные системы
Язык: русский
Кредиты: 3

Программа дисциплины

Аннотация

Студенты узнают базовые методы, метрики и концепции машинного обучения, необходимые для решения задач регрессии и классификации. Практическая часть курса реализовывается на языке Python. Курс является необходимым для изучения более продвинутых разделов машинного обучения.
Цель освоения дисциплины

Цель освоения дисциплины

  • 1. Знать базовые концепции и определения машинного обучения: виды постановки задач, виды признаков и т.д.
  • 2. Работать с табличными данными: загружать, сохранять, модифицировать, агрегировать, работать с пропущенными значениями и т.д.
  • 3. Знать и уметь применять методы ближайших соседей.
  • 4. Знать принцип работы линейной регрессии и ее модификаций (Lasso, Ridge) и уметь их применять.
  • 5. Знать принцип действия работы градиентного спуска.
  • 6. Знать принцип работы логистической регрессии и уметь ее применять.
  • 7. Знать основные метрики задач регрессии и классификации и уметь выбирать среди них оптимальную в зависимости от постановки задачи.
  • 8. Знать метод tf-idf и уметь применять его для текстовых данных.
Планируемые результаты обучения

Планируемые результаты обучения

  • MLFlow для экспериментов, Flask для HTTP API, Синхронный и асинхронный ML сервис, Docker для контейнеризации Python-сервиса
  • Определяет: - понятие и назначение MLOPS; - как правильно построить цикл обучения и отправки модели в производственную среду; - основные показатели мониторинга моделей машинного обучения.
  • Знает и понимает цели и задачи работы над отчетностью по проекту. Знает и понимает основы критического анализа проделанной работы. Знает и понимает требования, предъявляемые к итоговому анализу существа проектной документации для целей подготовки финального отчета и работы над ошибками в рамках реализации и презентации проекта. Способен применить полученные знания, умения и навыки в отношении смоделированной или конкретной жизненной ситуации, предполагающей реализацию проекта.
  • Создание рабочих процессов с помощью AirFlow, включая определение задач, настройку расписания выполнения, определение зависимостей и передачу данных между задачами
  • Имеют представление о базовых концепциях и определении машинного обучения: виды постановки задач, виды признаков и т.д.
  • Работать с табличными данными: загружать, сохранять, модифицировать, агрегировать, работать с пропущенными значениями и т.д.
  • Уметь применять методы ближайших соседей.
  • Владеть принципами работы линейной регрессии и ее модификаций (Lasso, Ridge) и уметь их применять.
  • Знакомы с принципом действия работы градиентного спуска.
  • Знакомы с принципом работы логистической регрессии и уметь ее применять.
  • Знакомы с основными метриками задач регрессии и классификации и выбирают среди них оптимальную в зависимости от постановки задачи.
  • Знакомы с методом tf-idf и применяют его для текстовых данных.
Содержание учебной дисциплины

Содержание учебной дисциплины

  • Введение MLOps
  • AirFlow Часть 1
  • AirFlow Часть 2
  • MLFlow
  • Финальный проект
Элементы контроля

Элементы контроля

  • неблокирующий Домашнее задание 1
  • неблокирующий Домашнее задание 2
  • неблокирующий Проект
Промежуточная аттестация

Промежуточная аттестация

  • 2024/2025 1st module
    0.2 * Домашнее задание 1 + 0.2 * Домашнее задание 2 + 0.6 * Проект
Список литературы

Список литературы

Рекомендуемая основная литература

  • Noah Gift, & Alfredo Deza. (2021). Practical MLOps: Vol. First edition. O’Reilly Media.
  • Харенслак, Б. Apache Airflow и конвейеры обработки данных / Б. Харенслак, Р. Д. де , перевод с английского Д. А. Беликова. — Москва : ДМК Пресс, 2022. — 502 с. — ISBN 978-5-97060-970-5. — Текст : электронный // Лань : электронно-библиотечная система. — URL: https://e.lanbook.com/book/241133 (дата обращения: 00.00.0000). — Режим доступа: для авториз. пользователей.

Рекомендуемая дополнительная литература

  • Криволапов, С. Я., Статистические вычисления на платформе Jupyter Notebook с использованием Python : учебник / С. Я. Криволапов. — Москва : КноРус, 2022. — 431 с. — ISBN 978-5-406-09739-7. — URL: https://book.ru/book/943660 (дата обращения: 27.08.2024). — Текст : электронный.

Авторы

  • Кантонистова Елена Олеговна
  • Ахмедова Гюнай Интигам кызы