2025/2026





Современный Computer Vision
Статус:
Маго-лего
Где читается:
Факультет компьютерных наук
Когда читается:
3 модуль
Охват аудитории:
для своего кампуса
Преподаватели:
Блуменау Марк Ильич
Язык:
русский
Кредиты:
3
Контактные часы:
28
Программа дисциплины
Аннотация
Курс охватывает основные задачи компьютерного зрения. В рамках курса слушатели научатся программно обрабатывать изображения, поймут на чем основаны все фоторедакторы. Затем они познакомятся с глубинным обучением для
основных задач с учителем, возникающих в зрении, а именно классификации, сегментации и детекции. В дополнении к задаче с учителем, слушатели познакомятся с генеративными моделями. Кроме того, в рамках курса слушатели узнают о поведении нейронных сетей для задачи зрения и признаках что они порождают. Научатся с ними работать.
Цель освоения дисциплины
- Работать с данными для характерных задач CV
- Подбирать алгоритм для конкретной задачи CV
- Эффективно обучать модели CV
- Оптимизировать модель для инференса
Планируемые результаты обучения
- Владеть навыками настройки гиперпараметров, применять Label Smoothing, аугментации и TTA.
- Понимать различие между семантической сегментацией и сегментацией объектов (instance segmentation).
- Владеть знаниями о классических методах трекинга (фильтр Калмана, SORT) и понимать, как интегрировать нейросети в процесс трекинга.
- Разбираться в пайплайне распознавания лиц и знать особенности построения систем ре-идентификации объектов.
- Знать основные архитектуры генеративных моделей: AE, VAE, GAN.
- Понимать механику репараметризации в VAE и уметь объяснить проблемы и тонкости обучения GAN.
- Уметь анализировать и сравнивать различные генеративные модели, понимать их сильные и слабые стороны.
- Понимать концепцию «foundation models» и области их использования.
- Уметь оценивать этические аспекты, риски и правовые вопросы при работе с крупными моделями.
Содержание учебной дисциплины
- Основные архитектуры CV
- Детекция и трекинг
- Сегментация
- Мультимодальность и VLM
- SSL & Foundation models
- Генеративные модели
- Классическое компьютерное зрение
Элементы контроля
- Домашнее задание 1Реализовать YOLO-like детектор собственными руками
- Домашнее задание 2Реализовать CLIP-like архитектуру своими руками
- Экзамен
Промежуточная аттестация
- 2025/2026 3rd module0.3 * Домашнее задание 1 + 0.3 * Домашнее задание 2 + 0.4 * Экзамен
Список литературы
Рекомендуемая основная литература
- Прикладная математика. Цифровая обработка изображений : учебно-методическое пособие / М. А. Гундина, М. А. Князев, Н. А. Кондратьева, О. В. Юхновская. — Минск : БНТУ, 2022. — 53 с. — ISBN 978-985-583-747-4. — Текст : электронный // Лань : электронно-библиотечная система. — URL: https://e.lanbook.com/book/325673 (дата обращения: 00.00.0000). — Режим доступа: для авториз. пользователей.
Рекомендуемая дополнительная литература
- Шилина, О. И. Цифровая обработка изображений : учебно-методическое пособие / О. И. Шилина, Д. А. Наумов, Е. А. Уварова. — Рязань : РГРТУ, 2021. — 265 с. — Текст : электронный // Лань : электронно-библиотечная система. — URL: https://e.lanbook.com/book/310580 (дата обращения: 00.00.0000). — Режим доступа: для авториз. пользователей.