Бакалавриат
2024/2025





Методы сжатия и передачи медиаданных
Статус:
Курс по выбору (Прикладная математика и информатика)
Направление:
01.03.02. Прикладная математика и информатика
Где читается:
Факультет компьютерных наук
Когда читается:
4-й курс, 3 модуль
Формат изучения:
без онлайн-курса
Охват аудитории:
для всех кампусов НИУ ВШЭ
Преподаватели:
Дремин Михаил Витальевич
Язык:
русский
Кредиты:
4
Программа дисциплины
Аннотация
В течение курса будут рассмотрены алгоритмы сжатия различных типов медиаданных (текст, изображения, видео), причем как классические подходы, так и современные методы с применением машинного обучения. Слушатели курса также познакомятся с тем, как различные медиаданные хранятся в памяти компьютера и научатся базовой обработке изображений и видео. В рамках читаемого курса будет предложено реализовать некоторые алгоритмы сжатия (арифметическое сжатие, фрактальное сжатие и компенсация движения).
Цель освоения дисциплины
- Знать основные современные алгоритмы обработки и сжатия медиаданных
- Владеть навыками реализации алгоритмов обработки и сжатия медиаданных на языках C/C++ и Python
- Владеть навыками программной работы с изображениями и видео
- Иметь представление об устройстве видеокодеков
- Иметь понимание об избыточности в текстах, изображениях и видео
Планируемые результаты обучения
- Уметь разрабатывать алгоритмы и программные системы для обработки и сжатия медиаданных
- Уметь участовать в соревнованиях в оптимизации алгоритмов и необходимые для этого навыки исследовательской работы
Содержание учебной дисциплины
- Арифметическое сжатие.
- Контекстное сжатие (PPM). Современные методы сжатия без потерь.
- Базовая работа и изображениями. Алгоритмы сжатия изображений.
- Фрактальное сжатие изображений.
- Алгоритмы сжатия изображений JPEG и JPEG2000.
- Камеры глубины.
- Оценка движения в видео и вычисление оптического потока.
- Метрики качества видео.
- Современные видеокодеки и их оптимизация.
- Стереоскопическое 3D видео.
Элементы контроля
- Домашнее задание 1Выдается после блока лекций № 1 и содержит 3 задачи, посвященных реализации базовых алгоритмов кодирования информации: дельта-кодирование, RLE, код Хаффмана. Решение каждой из задач может быть оценено максимум в 10 баллов.
- Домашнее задание 2Выдается после блока лекций № 2 и содержит 4 задач, посвященных реализации продвинутых алгоритмов кодирования информации: код Хаффмана с PPM, LZ77 и LZW, BWT и MTF. Решение каждой из задач может быть оценено максимум в 10 баллов.
- Домашнее задание 3Выдается после блока лекций № 3 и содержит 2 задачи, посвященных реализации алгоритмов кодирования звука: децимация сигналов, быстрое преобразование Фурье. Решение каждой из задач может быть оценено максимум в 10 баллов.
- Домашнее задание 4Выдается после блока лекций № 4 и содержит тест, содержащий вопросы по лекциям, посвященным сжатию звука. Решение теста может быть оценено максимум в 10 баллов.
- Домашнее задание 5Выдается после блока лекций № 5 и содержит 2 задачи, посвященных реализации алгоритмов кодирования изображений: преобразование цветовых пространств, PNG. Решение каждой из задач может быть оценено максимум в 10 баллов.
- Домашнее задание 6Выдается после блока лекций № 6 и содержит 2 задачи, посвященных реализации алгоритмов кодирования изображений: JPEG и вейвлетное преобразование. Решение каждой из задач может быть оценено максимум в 10 баллов.
- Домашнее задание 7Выдается после блока лекций № 7 и содержит 1 задачу, посвященную реализации алгоритма оптического потока Лукаса-Канаде. Решение задачи может быть оценено максимум в 10 баллов.
- Домашнее задание 8Выдается после блока лекций № 8 и содержит 1 задачу, посвященную реализации алгоритмов расчета метрик оценки качества изображений и видео: PSNR, SSIM, MS-SSIM. Решение задачи может быть оценено максимум в 10 баллов.
- Домашнее задание 9Выдается после блока лекций № 9 и содержит тест, содержащий вопросы по лекциям, посвященным 3D видео. Решение теста может быть оценено максимум в 10 баллов.
- Домашнее задание 10Выдается после блока лекций № 10 и содержит тест, содержащий вопросы по лекциям, посвященным картам глубины, интерполяции ракурсов, сжатию 360 видео. Решение теста может быть оценено максимум в 10 баллов.
- ЭкзаменЭкзамен проводится в письменной форме, дистанционно в формате теста. Студент получает вариант теста, который включает в себя шестьдесят вопросов из программы экзамена по всем лекциям курса. Во время подготовки можно использовать любые печатные материалы, но запрещается использовать электронные средства коммуникации. Оценка за экзамен выставляется по 60-балльной шкале на основании количества правильных ответов на вопросы теста. Экзаменационные тесты подготовлены в системе SmartLMS, выдаются на 1 час 45 минут.
Промежуточная аттестация
- 2024/2025 3rd moduleИтог = Округление((0.6 * ДЗ + 0.4 * Э)/(0.6 * ДЗ_макс + 0.4 Э_макс), где ДЗ — суммарная оценка за все задачи в домашних заданиях, Э — оценка за экзамен, ДЗ_макс — максимальная оценка за все задачи в домашних заданиях, Э_макс — максимальная оценка за экзамен.
Список литературы
Рекомендуемая основная литература
- Tanenbaum, A. S., & Steen, M. van. (2014). Distributed Systems: Pearson New International Edition : Principles and Paradigms (Vol. 2nd ed). Harlow, Essex: Pearson. Retrieved from http://search.ebscohost.com/login.aspx?direct=true&site=eds-live&db=edsebk&AN=1418515
- Ватолин, Д. С. Методы сжатия изображений : учебное пособие / Д. С. Ватолин. — 2-е изд. — Москва : ИНТУИТ, 2016. — 196 с. — Текст : электронный // Лань : электронно-библиотечная система. — URL: https://e.lanbook.com/book/100646 (дата обращения: 00.00.0000). — Режим доступа: для авториз. пользователей.
Рекомендуемая дополнительная литература
- Yuval Fisher. (2012). Fractal Image Compression : Theory and Application (Vol. 1995). Springer.