• A
  • A
  • A
  • АБB
  • АБB
  • АБB
  • А
  • А
  • А
  • А
  • А
Обычная версия сайта
Бакалавриат 2025/2026

Прикладные задачи видеоаналитики

Когда читается: 3-й курс, 3, 4 модуль
Охват аудитории: для своего кампуса
Язык: русский
Кредиты: 6
Контактные часы: 80

Программа дисциплины

Аннотация

Дисциплина посвящена анализу и применению современных архитектур компьютерного зрения в реальных прикладных сценариях и ориентирована на формирование у студентов инженерного мышления полного жизненного цикла CV-систем: от постановки задачи и подготовки данных до выбора архитектуры, обучения, оптимизации и развёртывания решения, пригодного для интеграции в производственные пайплайны. Курс показывает, как фундаментальные методы и модели, изучаемые в базовых курсах (свёрточные сети, трансформеры для зрения, модели внимания, типовые фреймворки детекции и сегментации), используются в прикладных задачах и какие ограничения возникают при переносе академических решений в реальные условия. Особое внимание уделяется факторам успешной интеграции: качеству данных и протоколов валидации, устойчивости к доменному сдвигу, воспроизводимости, масштабируемости, а также инженерной инфраструктуре инференса, мониторинга качества и регрессионного контроля. В рамках дисциплины рассматриваются типовые классы прикладных задач: классификация и детекция объектов в промышленности и медицине, анализ видеопотоков в системах безопасности и транспорта, визуальный контроль качества, элементы 3D-восприятия для робототехнических систем, а также мультимодальные и open-vocabulary подходы, соединяющие зрение с языковыми моделями. Важной частью курса является критическое сравнение академических и индустриальных подходов: почему одни решения сохраняются в исследовательских прототипах, а другие становятся частью сервисов и продуктов.
Цель освоения дисциплины

Цель освоения дисциплины

  • Цель дисциплины — сформировать у студентов способность проектировать, анализировать и обосновывать решения в области компьютерного зрения, ориентированные на внедрение: выбирать и адаптировать архитектуры под конкретные прикладные задачи и ограничения; оценивать качество и устойчивость решений; проектировать воспроизводимые прототипы, пригодные для интеграции в производственные системы; критически разбирать реальные кейсы внедрения и выявлять причины успехов и неудач.
Планируемые результаты обучения

Планируемые результаты обучения

  • Знает и понимает принципы постановки прикладных задач компьютерного зрения и типы выходов моделей; основные семейства архитектур и их свойства; типовые метрики качества и их связь с рисками/стоимостью ошибок; источники ошибок и деградации качества при внедрении ; базовые принципы инженерной интеграции CV-моделей.
  • Умеет формализовать задачу и требования ; выбирать метрики и протокол валидации, корректно интерпретировать результаты и выявлять leakage; собирать и документировать датасетный пайплайн, проводить анализ ошибок и разрабатывать план улучшений.
  • Умеет выбирать и адаптировать архитектуру под задачу и ограничения, реализовывать и сравнивать базовые и улучшенные решения на общих протоколах; проводить оценку устойчивости к доменному сдвигу и выбирать меры компенсации; проектировать воспроизводимый прототип и минимальный inference-сервис, измерять производительность, осуществлять базовую оптимизацию инференса; оформлять результаты в виде технической документации.
  • Владеет навыками критического анализа CV-решений в прикладном контексте, в том числе оценкой реализуемости внедрения, выявлением узких мест по данным/метрикам/инфраструктуре и формированием инженерных компромиссов.
Содержание учебной дисциплины

Содержание учебной дисциплины

  • Введение в прикладное компьютерное зрение как инженерный цикл
  • Данные и протоколы
  • Архитектуры как инструмент
  • Анализ ошибок и выбор operating point
  • Детекция в прикладных системах
  • Сегментация в задачах контроля качества и медицины
  • Документы и OCR как композиция модулей
  • Видео-аналитика
  • Open-vocabulary и эмбеддинги
  • Мультимодальные подходы
  • Устойчивость и domain shift
  • Синтетические данные и управление вариативностью
  • Генеративные модели как прикладной инструмент
  • Оптимизация модели и инференса
  • Инференс-пайплайн и интеграция
  • Мониторинг качества и дрейф
  • Воспроизводимость и документация
  • Академические и индустриальные подходы
Элементы контроля

Элементы контроля

  • неблокирующий Домашнее задание 1
    Инженерный пакет “Data + Protocol + Baseline”: постановка задачи, протокол валидации, baseline-модель, первичный анализ ошибок, воспроизводимость запуска.
  • неблокирующий Домашнее задание 2
    Инженерный пакет “Robustness + Optimization + Serving”: эксперимент на устойчивость/сдвиг домена, измерение производительности, шаг оптимизации, минимальный inference-сервис.
  • неблокирующий Итоговый проект
    Мини-проект (исследовательское или инженерное решение) для выбранной прикладной задачи (например, детекция дефектов, трекинг объектов, визуальный поиск, распознавание жестов, визуальная навигация и др.), сопровождаемый аналитическим отчётом и разбором применённых архитектурных и инженерных решений.
Промежуточная аттестация

Промежуточная аттестация

  • 2025/2026 4th module
    0.2 * Домашнее задание 2 + 0.2 * Домашнее задание 1 + 0.6 * Итоговый проект
Список литературы

Список литературы

Рекомендуемая основная литература

  • Асхатова, Л., Галимов, Э., & Габдуллин, И. (2015). Компьютерное Зрение. Retrieved from http://search.ebscohost.com/login.aspx?direct=true&site=eds-live&db=edsbas&AN=edsbas.6F41AB6F
  • Селянкин, В. В. Компьютерное зрение. Анализ и обработка изображений / В. В. Селянкин. — 3-е изд., стер. — Санкт-Петербург : Лань, 2023. — 152 с. — ISBN 978-5-507-45583-6. — Текст : электронный // Лань : электронно-библиотечная система. — URL: https://e.lanbook.com/book/276455 (дата обращения: 00.00.0000). — Режим доступа: для авториз. пользователей.

Авторы

  • Копылов Иван Станиславович