Бакалавриат
2025/2026




Исследовательские задачи в области больших языковых моделей
Статус:
Курс по выбору (Прикладная математика и информатика)
Кто читает:
Базовая кафедра Т-Банка
Где читается:
Факультет компьютерных наук
Когда читается:
3-й курс, 3, 4 модуль
Охват аудитории:
для своего кампуса
Язык:
русский
Кредиты:
6
Контактные часы:
80
Программа дисциплины
Аннотация
Это курс на базе лаборатории Omut AI, где проводятся фундаментальные исследования в области искусственного интеллекта (AI) и больших языковых моделей (LLM). На воркшопах студенты будут читать научные статьи и детально разбирать формализацию и реализацию описанных методов, технику проведения экспериментов, конъюнктуру, которая есть в этой теме. А ещё погружаться в проблемы в области AI, над которыми научное сообщество работает прямо сейчас, и проводить самостоятельные исследования на реальных данных.
Цель освоения дисциплины
- понимать теоретическое обоснование современных методов в RL for LLMs, Mechanistic Interpretability, Multimodal LLMs
- решать актуальные проблемы в области AI
- писать код для экспериментов — как для обучения моделей, так и для их валидации
- валидировать результаты в зависимости от целей исследований
- реализовывать новые методы
Планируемые результаты обучения
- Знает актуальные исследования AI (RL for LLMs, Mechanistic Interpretability, Multimodal LLMs)
- Умеет решать исследовательские задачи
- Умеет реализовывать методы, для которых может не существовать правильного решения
- Понимает теоретическое обоснование современных методов в RL for LLMs, Mechanistic Interpretability, Multimodal LLMs
- Решает актуальные проблемы в области AI
- Умеет писать код для экспериментов — как для обучения моделей, так и для их валидации
- Валидирует результаты в зависимости от целей исследований;
- Реализует новые методы
Содержание учебной дисциплины
- Основы RL-методов
- Интро в GRPO
- Агентность
- Основы In-context Learning
- Advanced research beyond GRPO
- Анализ репрезентаций в трансформерах
- Каузальный анализ трансформера и Circuit Discovery
- Hyper Networks
- Multimodal VLMs (basics)
- Agents and multi-step training
- World Models
- Vision-Language-Action models
Элементы контроля
- Домашнее заданиеМожно использовать AI для решения рутинных задач и генерации идей, например, для создания unit-тестов, если за них не начисляются баллы. Пользуйся AI осмысленно: тебе должен быть понятен результат, полученный c его помощью. Преподаватель или ассистент могут попросить объяснить устно, как работает твоё решение и почему оно устроено именно так. Если код в решении сгенерирован AI, то это нужно указать и обосновать применение нейросети.
- Коллоквиум
Список литературы
Рекомендуемая основная литература
- 19213 - Глубокое обучение - А.Гудфеллоу; А.Курвилль; И.Бенджио - ДМК Пресс - 9785970606186 - 2018 - https://hse.alpinadigital.ru/document/19213 - Alpina
- Python для сложных задач : наука о данных и машинное обучение, Плас, Дж. В., 2018
Рекомендуемая дополнительная литература
- Этика искусственного интеллекта: Кейсы и варианты решения этических проблем / пер. с англ. И. Кушнаревой; под науч. ред. А. Павлова; Нац. исслед. ун-т «Высшая школа экономики». — (Исследования культуры). - 978-5-7598-4053-4 - Шталь Бернд Карстен и др. - 2024 - Москва: ВШЭ - https://ibooks.ru/bookshelf/396123 - 396123 - iBOOKS