2025/2026
Мультимодальные нейронные сети
Статус:
Маго-лего
Когда читается:
2 модуль
Охват аудитории:
для своего кампуса
Язык:
русский
Контактные часы:
16
Программа дисциплины
Аннотация
Дисциплина посвящена современным архитектурам мультимодальных нейросетей и генеративных моделей. Курс охватывает модели, работающие с изображениями, аудио, видео и текстом, исследует методы контрастивного обучения, архитектуры типа CLIP, BLIP, VQGAN, DALL-E, а также механизмы генерации и токенизации мультимодальных данных. Лекции сопровождаются разбором практических задач и исследований, а также домашними заданиями по обучению адаптеров и генерации описаний по мультимодальному входу.