• A
  • A
  • A
  • АБB
  • АБB
  • АБB
  • А
  • А
  • А
  • А
  • А
Обычная версия сайта
Бакалавриат 2025/2026

Компьютерное зрение

Когда читается: 3-й курс, 3, 4 модуль
Охват аудитории: для своего кампуса
Язык: русский
Кредиты: 6
Контактные часы: 80

Программа дисциплины

Аннотация

Курс по компьютерному зрению знакомит студентов с основными подходами анализа и обработки изображений — от классических алгоритмов до современных state-of-the-art моделей на основе глубокого обучения. На занятиях студенты разберут фундаментальные методы компьютерного зрения, изучат архитектуры сверточных и трансформерных нейросетей, а также познакомятся с актуальными направлениями, такими как генеративные модели и большие визуально-языковые модели. Особое внимание уделено практике: каждое занятие сопровождается домашними заданиями, в которых предстоит реализовать ключевые алгоритмы и применить их для решения прикладных задач — классификации, детекции, сегментации, генерации и многих других. В результате студенты не только освоят теоретическую базу, но и получат опыт работы с современными библиотеками, что позволит им уверенно использовать инструменты компьютерного зрения в исследовательских и прикладных проектах.
Цель освоения дисциплины

Цель освоения дисциплины

  • Знать основные классические методы компьютерного зрения (фильтрация изображений, выделение признаков, детекторы и дескрипторы).
  • Уметь реализовывать и применять сверточные и трансформерные нейронные сети для решения задач классификации изображений.
  • Знать архитектуры современных моделей компьютерного зрения.
  • Уметь разрабатывать и обучать модели для задач детекции и сегментации объектов.
  • Владеть методами metric learning и уметь применять их для поиска и сравнения изображений.
  • Знать принципы и уметь использовать генеративные модели в задачах компьютерного зрения.
  • Знать основы vision-language моделей (VLM) и уметь применять их для мультимодальных задач.
  • Владеть инструментами практической разработки в области компьютерного зрения и уметь строить рабочие пайплайны для прикладных задач.
Планируемые результаты обучения

Планируемые результаты обучения

  • Знает основные классические методы компьютерного зрения (фильтрация изображений, выделение признаков, детекторы и дескрипторы).
  • Умеет реализовывать и применять сверточные и трансформерные нейронные сети для решения задач классификации изображений.
  • Знает архитектуры современных моделей компьютерного зрения.
  • Умеет разрабатывать и обучать модели для задач детекции и сегментации объектов.
  • Владеет методами metric learning и уметь применять их для поиска и сравнения изображений
  • Знает принципы и уметь использовать генеративные модели в задачах компьютерного зрения.
  • Знает основы vision-language моделей (VLM) и уметь применять их для мультимодальных задач.
  • Владеет инструментами практической разработки в области компьютерного зрения и уметь строить рабочие пайплайны для прикладных задач.
Содержание учебной дисциплины

Содержание учебной дисциплины

  • Image Processing and Classical CV
  • Classic CV + basic 3D
  • DL foundations: Convolutional NN in CV
  • Transformers in CV
  • Object Detection
  • Спецсеминар: YOLO Object Detection Family
  • Segmentation
  • Metric Learning
  • Variational Aautoencoders & Generative Adversarial Networks
  • Diffusion Family
  • Autoregressive models and Normalizing Flows
  • Adapters & SOTA Image Generation
  • VLM: Basics
  • VLM for any applications
Элементы контроля

Элементы контроля

  • неблокирующий Домашнее задание
  • неблокирующий Экззамен
Промежуточная аттестация

Промежуточная аттестация

  • 2025/2026 4th module
    ДЗ = максимум(10, S / (N – K)) Где S – сумма за все домашние задания N - кол-во выданных домашних заданий K – кол-во домашних заданий, которые мы простим (K = 2) (?) ПК – понижающий коэффициент. В случаях, когда студент сдает после мягкого дедлайна, результат его работы умножается на ПК ПК = 0.8 в первую неделю после дедлайна; 0.6 во вторую неделю после дедлайна и 0.4 во все последующие недели Итог = Округление(0.7 * ДЗ + 0.3 * Э) (?) где Э — оценка за экзамен. Округление арифметическое. Описание автоматов: Определим накопленную оценку как Накоп = Округление(0.7 * ДЗ). Если Накоп >=6, то студент может получить Накоп в качестве итоговой оценки, не приходя на экзамен (студент не может получить оценку “Отлично”, не приходя на экзамен)
Список литературы

Список литературы

Рекомендуемая основная литература

  • Компьютерное зрение. Современные методы и перспективы развития, , 2022

Рекомендуемая дополнительная литература

  • Компьютерное зрение / пер. с англ. — 5-е изд., электрон. — (Лучший зарубежный учебник) - 978-5-93208-725-1 - Шапиро Л., Стокман Дж. - 2024 - Москва: Лаборатория знаний - https://ibooks.ru/bookshelf/396375 - 396375 - iBOOKS
  • Селянкин, В. В. Компьютерное зрение. Анализ и обработка изображений / В. В. Селянкин. — 3-е изд., стер. — Санкт-Петербург : Лань, 2023. — 152 с. — ISBN 978-5-507-45583-6. — Текст : электронный // Лань : электронно-библиотечная система. — URL: https://e.lanbook.com/book/276455 (дата обращения: 00.00.0000). — Режим доступа: для авториз. пользователей.

Авторы

  • Солдатова Татьяна Владимировна