• A
  • A
  • A
  • АБB
  • АБB
  • АБB
  • А
  • А
  • А
  • А
  • А
Обычная версия сайта
Бакалавриат 2025/2026

Искусственный интеллект в мультимедиа

Статус: Курс обязательный (Информатика и вычислительная техника)
Когда читается: 4-й курс, 1-3 модуль
Охват аудитории: для своего кампуса
Язык: русский

Программа дисциплины

Аннотация

Курс "Искусственный интеллект в мультимедиа" представляет собой углубленное изучение современных методов и алгоритмов компьютерного зрения, обработки изображений, звука и видео. В рамках курса будут рассмотрены как классические подходы, так и новейшие нейросетевые решения для анализа и генерации мультимедийного контента. Основные темы курса включают: Классические алгоритмы компьютерного зрения: Изучение основ компьютерного зрения, включая алгоритмы обработки изображений и базовые методы анализа сцены. Основы глубинного обучения: Овладение современными методами глубокого обучения, включая сверточные нейронные сети (CNN), для анализа изображений. Практические задачи компьютерного зрения: Рассмотрение аспектов применения компьютерного зрения в таких задачах как обнаружение объектов, трекинг объектов, оптическое распознавание символов (OCR), распознавание лиц. Порождающие модели (GAN, VAE, Diffusion): Обзор и применение продвинутых генеративных моделей для создания изображений, видео и других типов данных. Трансформеры и обработка последовательностей: Обзор архитектур нейронных сетей для обработки последовательных данных (тексты, аудио, видео) с акцентом на актуальные решений на основе трансформерной архитектуры. Курс предназначен для студентов, интересующихся применением искусственного интеллекта в области мультимедийных технологий, и охватывает как теоретические основы, так и практические аспекты разработки и внедрения AI-решений для работы с мультимедиа данными. В ходе обучения слушатели получат навыки работы с современными инструментами и библиотеками, такими как Ultralytics, OpenCV, PIL, PyTorch и освоят техники, применимые в реальных проектах.
Цель освоения дисциплины

Цель освоения дисциплины

  • Формирование у студентов представления о современных алгоритмах искусственного интеллекта в сфере обработки мультимедиа-данных
  • Формирование у студентов навыков применения методов компьютерного зрения и генеративного искусственного интеллекта для решения задач обработки мультимедиа-данных
Планируемые результаты обучения

Планируемые результаты обучения

  • Студенты имеют представление о том как работают системы распознавания лиц.
  • Дать определение компьютерного зрения
  • Перечислить методы и задачи компьютерного зрения
  • Студент способен применять на практике современные модели обнаружения объектов
  • Студенты способны применять на практике современные модели распознавания лиц
Содержание учебной дисциплины

Содержание учебной дисциплины

  • Введение в машинное обучение и компьютерное зрение
  • Классификация изображений
  • Использование нейронных сетей для решения задачи обнаружения объектов на изображении
  • Трекинг объектов
  • Распознавание лиц
  • OCR
  • Генеративные модели
  • Обработка последовательностей и трансформерные архитектуры
Элементы контроля

Элементы контроля

  • неблокирующий Практическая работа 1. Работа с изображениями на языке Python.
  • блокирующий Практическая работа 2. Знакомство с PyTorch
  • блокирующий Практическая работа 3. Знакомство с архитектурой ResNet.
  • блокирующий Практическая работа 4. Классификация изображений
  • блокирующий Практическая работа 5. Обнаружение объектов.
  • блокирующий Практическая работа 6. Трекинг объектов.
  • блокирующий Практическая работа 7. Распознавание лиц.
  • блокирующий Практическая работа 8. Генеративные модели.
  • неблокирующий Практическая работе 9. DeepFake.
Промежуточная аттестация

Промежуточная аттестация

  • 2025/2026 2nd module
    0.1 * Практическая работа 1. Работа с изображениями на языке Python. + 0.15 * Практическая работа 2. Знакомство с PyTorch + 0.15 * Практическая работа 3. Знакомство с архитектурой ResNet. + 0.2 * Практическая работа 4. Классификация изображений + 0.2 * Практическая работа 5. Обнаружение объектов. + 0.2 * Практическая работа 6. Трекинг объектов.
  • 2025/2026 3rd module
    0.35 * Практическая работа 7. Распознавание лиц. + 0.5 * Практическая работа 8. Генеративные модели. + 0.15 * Практическая работе 9. DeepFake.
Список литературы

Список литературы

Рекомендуемая основная литература

  • Компьютерное зрение. Современные методы и перспективы развития, , 2022
  • Цифровая обработка изображений, Гонсалес, Р., 2012

Рекомендуемая дополнительная литература

  • Нейросетевые системы искусственного интеллекта в задачах обработки изображений, Акинин, М. В., 2016

Авторы

  • Рыбаков Петр Владимирович