Магистратура
2025/2026



Глубинное зрение и графика
Статус:
Курс по выбору (Современные компьютерные науки)
Кто читает:
Базовая кафедра Яндекс
Где читается:
Факультет компьютерных наук
Когда читается:
1-й курс, 1, 2 модуль
Охват аудитории:
для своего кампуса
Язык:
русский
Программа дисциплины
Аннотация
Курс посвящен основным задачам и методам компьютерного зрения, таким как обработка изображений, совмещение и сопоставление изображений, классификация изображений, поиск изображений по содержанию, выделение объектов, сегментация объектов, стилизация изображений, синтез изображений, вычисление оптического потока, сопровождение одиночных и множественных целей, распознавание событий, трёхмерная реконструкция по изображениям. Для освоения учебной дисциплины студенты должны владеть знаниями и компетенциями следующих дисциплин: Математический анализ; Линейная алгебра и геометрия; Теория вероятностей и математическая статистика; Основы и методология программирования; Алгоритмы и структуры данных; Машинное обучение 1; Машинное обучение 2; Введение в глубинное обучение.
Цель освоения дисциплины
- Курс нацелен на ознакомление с современными нейросетевыми методами в компьютерном зрении и в компьютерной графике.
Планируемые результаты обучения
- Разбираться в современных нейросетевых методах в компьютерном зрении и в компьютерной графике
Содержание учебной дисциплины
- Intro, recap of Neural network basics, optimization, backprop, biological networks
- Images, linear filtering, convolutional networks, batchnorms, augmentations.
- ConvNet architectures and how to find them, transfer learning
- Dense prediction: semantic segmentation, superresolution/image synthesis, perceptual losse
- Non-convolutional architectures: vision transformers, mixers, FFT convolutions.
- Visualizing and understanding deep architectures, adversarial examples.
- Object detection, instance/panoptic segmentation.
- Representation learning: face recognition, verification tasks, self-supervised learning, few-shot learning, image captioning, CLIP.
- Latent models (generative latent optimization, autoencoders, DALL-E, flow models).
- Generative adversarial networks.
- Shape and motion estimation: spatial transformers, optical flow, stereo, monodepth, point cloud generation, implicit and semi-implicit shape representations.
- New view synthesis: multi-plane images, neural radiance fields, mesh-based and point-based representations for NVS, neural renderers.
Список литературы
Рекомендуемая основная литература
- Computer vision : models, learning, and inference, Prince, S. J. D., 2012
- Ian Goodfellow and Yoshua Bengio and Aaron Courville. Deep Learning, 2016. URL: http://www.deeplearningbook.org
- Kelleher, J. D. (2019). Deep Learning. Cambridge: The MIT Press. Retrieved from http://search.ebscohost.com/login.aspx?direct=true&site=eds-live&db=edsebk&AN=2234376
- Prince, S. J. D. (2012). Computer Vision : Models, Learning, and Inference. New York: Cambridge eText. Retrieved from http://search.ebscohost.com/login.aspx?direct=true&site=eds-live&db=edsebk&AN=458656
- Siddhartha Bhattacharyya, Vaclav Snasel, Aboul Ella Hassanien, Satadal Saha, & B. K. Tripathy. (2020). Deep Learning : Research and Applications. De Gruyter.
- Wojciechowski, K. (2006). Computer Vision and Graphics : International Conference, ICCVG 2004, Warsaw, Poland, September 2004, Proceedings. Dordrecht: Springer. Retrieved from http://search.ebscohost.com/login.aspx?direct=true&site=eds-live&db=edsebk&AN=155987
- Компьютерная геометрия и графика : учебник для вузов, Дегтярев, В. М., 2013
- Компьютерное зрение. Современные методы и перспективы развития, , 2022
Рекомендуемая дополнительная литература
- Deep learning, Kelleher, J. D., 2019