Бакалавриат
2025/2026





Прикладные задачи видеоаналитики
Статус:
Курс по выбору (Прикладная математика и информатика)
Кто читает:
Базовая кафедра МТС
Где читается:
Факультет компьютерных наук
Когда читается:
3-й курс, 3, 4 модуль
Охват аудитории:
для своего кампуса
Преподаватели:
Копылов Иван Станиславович
Язык:
русский
Кредиты:
6
Контактные часы:
80
Программа дисциплины
Аннотация
Курс посвящён анализу и применению современных архитектур компьютерного зрения в реальных прикладных сценариях. Основная цель — показать, как фундаментальные методы и модели, изучаемые в базовых курсах (свёрточные сети, Vision Transformers, архитектуры на основе внимания, сегментационные и детекционные фреймворки), используются для решения конкретных инженерных задач и как эти решения интегрируются в производственные системы.
В рамках курса рассматриваются типичные классы прикладных задач: классификация и детекция объектов в промышленных и медицинских изображениях, анализ видеопотоков в системах безопасности и транспорта, построение систем визуального контроля качества, реконструкция сцены и 3D-восприятие для робототехнических систем, а также мультимодальные и open-vocabulary подходы, соединяющие зрение с языковыми моделями. Особое внимание уделяется анализу внедрения технологий компьютерного зрения в различных контекстах — от лабораторных прототипов до промышленных и сервисных решений. Курс рассматривает как факторы, способствующие успешной интеграции моделей (качество данных, инженерная инфраструктура, устойчивость к сдвигу домена), так и типичные причины неудач при переносе академических моделей в реальные условия: переобучение, отсутствие масштабируемости, ошибки в постановке задачи и ограниченность метрик оценки.
Студенты познакомятся с полным циклом жизни компьютерно-зрительных систем — от постановки задачи и подготовки датасета до выбора архитектуры, обучения, оптимизации и развёртывания модели. Отдельные занятия будут посвящены сравнению академических и индустриальных подходов: почему одни модели остаются в статьях, а другие становятся частью сервисов и продуктов.
Цель освоения дисциплины
- По итогам курса слушатели смогут: • понимать, как выбирать и адаптировать архитектуру под конкретную прикладную задачу; • анализировать качество и устойчивость систем компьютерного зрения при внедрении; • проектировать и документировать прототипы, пригодные для интеграции в производственные пайплайны; • критически оценивать реальные кейсы использования CV-моделей, выявляя причины успехов и неудач.
Планируемые результаты обучения
- знать: - что такое компьютерное зрение; - сверточные нейронные сети; - сверточные нейронные сети-2; - сверточные нейронные сети-3; - современные архитектуры нейронных сетей; - проблемы сверточных сетей в задачах классификации изображений; - сверточные сети и DeepDream.
Содержание учебной дисциплины
- Компьютерное зрение
- Свёрточные сети
- Vision Transformers
- Архитектуры на основе внимания
- Сегментационные и детекционные фреймворки
Элементы контроля
- Домашнее задание 1
- Домашнее задание 2
- Итоговый проектФинальным результатом курса станет мини-проект — исследовательское или инженерное решение для выбранной прикладной задачи (например, детекция дефектов, трекинг объектов, визуальный поиск, распознавание жестов, визуальная навигация), сопровождаемое аналитическим отчётом и разбором применённых архитектурных и инженерных решений.
Промежуточная аттестация
- 2025/2026 4th module0.2 * Домашнее задание 1 + 0.2 * Домашнее задание 2 + 0.6 * Итоговый проект
Список литературы
Рекомендуемая основная литература
- Асхатова, Л., Галимов, Э., & Габдуллин, И. (2015). Компьютерное Зрение. Retrieved from http://search.ebscohost.com/login.aspx?direct=true&site=eds-live&db=edsbas&AN=edsbas.6F41AB6F
- Селянкин, В. В. Компьютерное зрение. Анализ и обработка изображений / В. В. Селянкин. — 3-е изд., стер. — Санкт-Петербург : Лань, 2023. — 152 с. — ISBN 978-5-507-45583-6. — Текст : электронный // Лань : электронно-библиотечная система. — URL: https://e.lanbook.com/book/276455 (дата обращения: 00.00.0000). — Режим доступа: для авториз. пользователей.
Рекомендуемая дополнительная литература
- Тёрк, М. Компьютерное зрение. Передовые методы и глубокое обучение / М. Тёрк, Р. Дэвис , перевод с английского В. С. Яценкова. — Москва : ДМК Пресс, 2022. — 690 с. — ISBN 978-5-93700-148-1. — Текст : электронный // Лань : электронно-библиотечная система. — URL: https://e.lanbook.com/book/314900 (дата обращения: 00.00.0000). — Режим доступа: для авториз. пользователей.