Бакалавриат
2025/2026





Прикладные задачи видеоаналитики
Статус:
Курс по выбору (Прикладная математика и информатика)
Кто читает:
Базовая кафедра МТС
Где читается:
Факультет компьютерных наук
Когда читается:
3-й курс, 3, 4 модуль
Охват аудитории:
для своего кампуса
Преподаватели:
Копылов Иван Станиславович
Язык:
русский
Кредиты:
6
Контактные часы:
80
Программа дисциплины
Аннотация
Дисциплина посвящена анализу и применению современных архитектур компьютерного зрения в реальных прикладных сценариях и ориентирована на формирование у студентов инженерного мышления полного жизненного цикла CV-систем: от постановки задачи и подготовки данных до выбора архитектуры, обучения, оптимизации и развёртывания решения, пригодного для интеграции в производственные пайплайны.
Курс показывает, как фундаментальные методы и модели, изучаемые в базовых курсах (свёрточные сети, трансформеры для зрения, модели внимания, типовые фреймворки детекции и сегментации), используются в прикладных задачах и какие ограничения возникают при переносе академических решений в реальные условия. Особое внимание уделяется факторам успешной интеграции: качеству данных и протоколов валидации, устойчивости к доменному сдвигу, воспроизводимости, масштабируемости, а также инженерной инфраструктуре инференса, мониторинга качества и регрессионного контроля.
В рамках дисциплины рассматриваются типовые классы прикладных задач: классификация и детекция объектов в промышленности и медицине, анализ видеопотоков в системах безопасности и транспорта, визуальный контроль качества, элементы 3D-восприятия для робототехнических систем, а также мультимодальные и open-vocabulary подходы, соединяющие зрение с языковыми моделями. Важной частью курса является критическое сравнение академических и индустриальных подходов: почему одни решения сохраняются в исследовательских прототипах, а другие становятся частью сервисов и продуктов.
Цель освоения дисциплины
- Цель дисциплины — сформировать у студентов способность проектировать, анализировать и обосновывать решения в области компьютерного зрения, ориентированные на внедрение: выбирать и адаптировать архитектуры под конкретные прикладные задачи и ограничения; оценивать качество и устойчивость решений; проектировать воспроизводимые прототипы, пригодные для интеграции в производственные системы; критически разбирать реальные кейсы внедрения и выявлять причины успехов и неудач.
Планируемые результаты обучения
- Знает и понимает принципы постановки прикладных задач компьютерного зрения и типы выходов моделей; основные семейства архитектур и их свойства; типовые метрики качества и их связь с рисками/стоимостью ошибок; источники ошибок и деградации качества при внедрении ; базовые принципы инженерной интеграции CV-моделей.
- Умеет формализовать задачу и требования ; выбирать метрики и протокол валидации, корректно интерпретировать результаты и выявлять leakage; собирать и документировать датасетный пайплайн, проводить анализ ошибок и разрабатывать план улучшений.
- Умеет выбирать и адаптировать архитектуру под задачу и ограничения, реализовывать и сравнивать базовые и улучшенные решения на общих протоколах; проводить оценку устойчивости к доменному сдвигу и выбирать меры компенсации; проектировать воспроизводимый прототип и минимальный inference-сервис, измерять производительность, осуществлять базовую оптимизацию инференса; оформлять результаты в виде технической документации.
- Владеет навыками критического анализа CV-решений в прикладном контексте, в том числе оценкой реализуемости внедрения, выявлением узких мест по данным/метрикам/инфраструктуре и формированием инженерных компромиссов.
Содержание учебной дисциплины
- Введение в прикладное компьютерное зрение как инженерный цикл
- Данные и протоколы
- Архитектуры как инструмент
- Анализ ошибок и выбор operating point
- Детекция в прикладных системах
- Сегментация в задачах контроля качества и медицины
- Документы и OCR как композиция модулей
- Видео-аналитика
- Open-vocabulary и эмбеддинги
- Мультимодальные подходы
- Устойчивость и domain shift
- Синтетические данные и управление вариативностью
- Генеративные модели как прикладной инструмент
- Оптимизация модели и инференса
- Инференс-пайплайн и интеграция
- Мониторинг качества и дрейф
- Воспроизводимость и документация
- Академические и индустриальные подходы
Элементы контроля
- Домашнее задание 1Инженерный пакет “Data + Protocol + Baseline”: постановка задачи, протокол валидации, baseline-модель, первичный анализ ошибок, воспроизводимость запуска.
- Домашнее задание 2Инженерный пакет “Robustness + Optimization + Serving”: эксперимент на устойчивость/сдвиг домена, измерение производительности, шаг оптимизации, минимальный inference-сервис.
- Итоговый проектМини-проект (исследовательское или инженерное решение) для выбранной прикладной задачи (например, детекция дефектов, трекинг объектов, визуальный поиск, распознавание жестов, визуальная навигация и др.), сопровождаемый аналитическим отчётом и разбором применённых архитектурных и инженерных решений.
Промежуточная аттестация
- 2025/2026 4th module0.2 * Домашнее задание 2 + 0.2 * Домашнее задание 1 + 0.6 * Итоговый проект
Список литературы
Рекомендуемая основная литература
- Асхатова, Л., Галимов, Э., & Габдуллин, И. (2015). Компьютерное Зрение. Retrieved from http://search.ebscohost.com/login.aspx?direct=true&site=eds-live&db=edsbas&AN=edsbas.6F41AB6F
- Селянкин, В. В. Компьютерное зрение. Анализ и обработка изображений / В. В. Селянкин. — 3-е изд., стер. — Санкт-Петербург : Лань, 2023. — 152 с. — ISBN 978-5-507-45583-6. — Текст : электронный // Лань : электронно-библиотечная система. — URL: https://e.lanbook.com/book/276455 (дата обращения: 00.00.0000). — Режим доступа: для авториз. пользователей.