• A
  • A
  • A
  • АБB
  • АБB
  • АБB
  • А
  • А
  • А
  • А
  • А
Обычная версия сайта
Бакалавриат 2024/2025

Методы сжатия и передачи медиаданных

Направление: 01.03.02. Прикладная математика и информатика
Когда читается: 4-й курс, 3 модуль
Формат изучения: без онлайн-курса
Охват аудитории: для всех кампусов НИУ ВШЭ
Преподаватели: Дремин Михаил Витальевич
Язык: русский
Кредиты: 4

Программа дисциплины

Аннотация

В течение курса будут рассмотрены алгоритмы сжатия различных типов медиаданных (текст, изображения, видео), причем как классические подходы, так и современные методы с применением машинного обучения. Слушатели курса также познакомятся с тем, как различные медиаданные хранятся в памяти компьютера и научатся базовой обработке изображений и видео. В рамках читаемого курса будет предложено реализовать некоторые алгоритмы сжатия (арифметическое сжатие, фрактальное сжатие и компенсация движения).
Цель освоения дисциплины

Цель освоения дисциплины

  • Знать основные современные алгоритмы обработки и сжатия медиаданных
  • Владеть навыками реализации алгоритмов обработки и сжатия медиаданных на языках C/C++ и Python
  • Владеть навыками программной работы с изображениями и видео
  • Иметь представление об устройстве видеокодеков
  • Иметь понимание об избыточности в текстах, изображениях и видео
Планируемые результаты обучения

Планируемые результаты обучения

  • Уметь разрабатывать алгоритмы и программные системы для обработки и сжатия медиаданных
  • Уметь участовать в соревнованиях в оптимизации алгоритмов и необходимые для этого навыки исследовательской работы
Содержание учебной дисциплины

Содержание учебной дисциплины

  • Арифметическое сжатие.
  • Контекстное сжатие (PPM). Современные методы сжатия без потерь.
  • Базовая работа и изображениями. Алгоритмы сжатия изображений.
  • Фрактальное сжатие изображений.
  • Алгоритмы сжатия изображений JPEG и JPEG2000.
  • Камеры глубины.
  • Оценка движения в видео и вычисление оптического потока.
  • Метрики качества видео.
  • Современные видеокодеки и их оптимизация.
  • Стереоскопическое 3D видео.
Элементы контроля

Элементы контроля

  • неблокирующий Домашнее задание 1
    Выдается после блока лекций № 1 и содержит 3 задачи, посвященных реализации базовых алгоритмов кодирования информации: дельта-кодирование, RLE, код Хаффмана. Решение каждой из задач может быть оценено максимум в 10 баллов.
  • неблокирующий Домашнее задание 2
    Выдается после блока лекций № 2 и содержит 4 задач, посвященных реализации продвинутых алгоритмов кодирования информации: код Хаффмана с PPM, LZ77 и LZW, BWT и MTF. Решение каждой из задач может быть оценено максимум в 10 баллов.
  • неблокирующий Домашнее задание 3
    Выдается после блока лекций № 3 и содержит 2 задачи, посвященных реализации алгоритмов кодирования звука: децимация сигналов, быстрое преобразование Фурье. Решение каждой из задач может быть оценено максимум в 10 баллов.
  • неблокирующий Домашнее задание 4
    Выдается после блока лекций № 4 и содержит тест, содержащий вопросы по лекциям, посвященным сжатию звука. Решение теста может быть оценено максимум в 10 баллов.
  • неблокирующий Домашнее задание 5
    Выдается после блока лекций № 5 и содержит 2 задачи, посвященных реализации алгоритмов кодирования изображений: преобразование цветовых пространств, PNG. Решение каждой из задач может быть оценено максимум в 10 баллов.
  • неблокирующий Домашнее задание 6
    Выдается после блока лекций № 6 и содержит 2 задачи, посвященных реализации алгоритмов кодирования изображений: JPEG и вейвлетное преобразование. Решение каждой из задач может быть оценено максимум в 10 баллов.
  • неблокирующий Домашнее задание 7
    Выдается после блока лекций № 7 и содержит 1 задачу, посвященную реализации алгоритма оптического потока Лукаса-Канаде. Решение задачи может быть оценено максимум в 10 баллов.
  • неблокирующий Домашнее задание 8
    Выдается после блока лекций № 8 и содержит 1 задачу, посвященную реализации алгоритмов расчета метрик оценки качества изображений и видео: PSNR, SSIM, MS-SSIM. Решение задачи может быть оценено максимум в 10 баллов.
  • неблокирующий Домашнее задание 9
    Выдается после блока лекций № 9 и содержит тест, содержащий вопросы по лекциям, посвященным 3D видео. Решение теста может быть оценено максимум в 10 баллов.
  • неблокирующий Домашнее задание 10
    Выдается после блока лекций № 10 и содержит тест, содержащий вопросы по лекциям, посвященным картам глубины, интерполяции ракурсов, сжатию 360 видео. Решение теста может быть оценено максимум в 10 баллов.
  • неблокирующий Экзамен
    Экзамен проводится в письменной форме, дистанционно в формате теста. Студент получает вариант теста, который включает в себя шестьдесят вопросов из программы экзамена по всем лекциям курса. Во время подготовки можно использовать любые печатные материалы, но запрещается использовать электронные средства коммуникации. Оценка за экзамен выставляется по 60-балльной шкале на основании количества правильных ответов на вопросы теста. Экзаменационные тесты подготовлены в системе SmartLMS, выдаются на 1 час 45 минут.
Промежуточная аттестация

Промежуточная аттестация

  • 2024/2025 3rd module
    Итог = Округление((0.6 * ДЗ + 0.4 * Э)/(0.6 * ДЗ_макс + 0.4 Э_макс), где ДЗ — суммарная оценка за все задачи в домашних заданиях, Э — оценка за экзамен, ДЗ_макс — максимальная оценка за все задачи в домашних заданиях, Э_макс — максимальная оценка за экзамен.
Список литературы

Список литературы

Рекомендуемая основная литература

  • Tanenbaum, A. S., & Steen, M. van. (2014). Distributed Systems: Pearson New International Edition : Principles and Paradigms (Vol. 2nd ed). Harlow, Essex: Pearson. Retrieved from http://search.ebscohost.com/login.aspx?direct=true&site=eds-live&db=edsebk&AN=1418515
  • Ватолин, Д. С. Методы сжатия изображений : учебное пособие / Д. С. Ватолин. — 2-е изд. — Москва : ИНТУИТ, 2016. — 196 с. — Текст : электронный // Лань : электронно-библиотечная система. — URL: https://e.lanbook.com/book/100646 (дата обращения: 00.00.0000). — Режим доступа: для авториз. пользователей.

Рекомендуемая дополнительная литература

  • Yuval Fisher. (2012). Fractal Image Compression : Theory and Application (Vol. 1995). Springer.

Авторы

  • Бардуков Анатолий Андреевич
  • Кононова Елизавета Дмитриевна