• A
  • A
  • A
  • АБB
  • АБB
  • АБB
  • А
  • А
  • А
  • А
  • А
Обычная версия сайта
2025/2026

Современный Computer Vision

Статус: Маго-лего
Когда читается: 3 модуль
Охват аудитории: для своего кампуса
Преподаватели: Блуменау Марк Ильич
Язык: русский
Кредиты: 3
Контактные часы: 28

Программа дисциплины

Аннотация

Курс охватывает основные задачи компьютерного зрения. В рамках курса слушатели научатся программно обрабатывать изображения, поймут на чем основаны все фоторедакторы. Затем они познакомятся с глубинным обучением для основных задач с учителем, возникающих в зрении, а именно классификации, сегментации и детекции. В дополнении к задаче с учителем, слушатели познакомятся с генеративными моделями. Кроме того, в рамках курса слушатели узнают о поведении нейронных сетей для задачи зрения и признаках что они порождают. Научатся с ними работать.
Цель освоения дисциплины

Цель освоения дисциплины

  • Работать с данными для характерных задач CV
  • Подбирать алгоритм для конкретной задачи CV
  • Эффективно обучать модели CV
  • Оптимизировать модель для инференса
Планируемые результаты обучения

Планируемые результаты обучения

  • Владеть навыками настройки гиперпараметров, применять Label Smoothing, аугментации и TTA.
  • Понимать различие между семантической сегментацией и сегментацией объектов (instance segmentation).
  • Владеть знаниями о классических методах трекинга (фильтр Калмана, SORT) и понимать, как интегрировать нейросети в процесс трекинга.
  • Разбираться в пайплайне распознавания лиц и знать особенности построения систем ре-идентификации объектов.
  • Знать основные архитектуры генеративных моделей: AE, VAE, GAN.
  • Понимать механику репараметризации в VAE и уметь объяснить проблемы и тонкости обучения GAN.
  • Уметь анализировать и сравнивать различные генеративные модели, понимать их сильные и слабые стороны.
  • Понимать концепцию «foundation models» и области их использования.
  • Уметь оценивать этические аспекты, риски и правовые вопросы при работе с крупными моделями.
Содержание учебной дисциплины

Содержание учебной дисциплины

  • Основные архитектуры CV
  • Детекция и трекинг
  • Сегментация
  • Мультимодальность и VLM
  • SSL & Foundation models
  • Генеративные модели
  • Классическое компьютерное зрение
Элементы контроля

Элементы контроля

  • неблокирующий Домашнее задание 1
    Реализовать YOLO-like детектор собственными руками
  • неблокирующий Домашнее задание 2
    Реализовать CLIP-like архитектуру своими руками
  • неблокирующий Экзамен
Промежуточная аттестация

Промежуточная аттестация

  • 2025/2026 3rd module
    0.3 * Домашнее задание 1 + 0.3 * Домашнее задание 2 + 0.4 * Экзамен
Список литературы

Список литературы

Рекомендуемая основная литература

  • Прикладная математика. Цифровая обработка изображений : учебно-методическое пособие / М. А. Гундина, М. А. Князев, Н. А. Кондратьева, О. В. Юхновская. — Минск : БНТУ, 2022. — 53 с. — ISBN 978-985-583-747-4. — Текст : электронный // Лань : электронно-библиотечная система. — URL: https://e.lanbook.com/book/325673 (дата обращения: 00.00.0000). — Режим доступа: для авториз. пользователей.

Рекомендуемая дополнительная литература

  • Шилина, О. И. Цифровая обработка изображений : учебно-методическое пособие / О. И. Шилина, Д. А. Наумов, Е. А. Уварова. — Рязань : РГРТУ, 2021. — 265 с. — Текст : электронный // Лань : электронно-библиотечная система. — URL: https://e.lanbook.com/book/310580 (дата обращения: 00.00.0000). — Режим доступа: для авториз. пользователей.

Авторы

  • Ахмедова Гюнай Интигам кызы