2025/2026





Практическое применение агентских систем
Статус:
Маго-лего
Где читается:
Факультет компьютерных наук
Когда читается:
2 модуль
Охват аудитории:
для своего кампуса
Язык:
русский
Кредиты:
3
Контактные часы:
28
Программа дисциплины
Аннотация
Дисциплина направлена на формирование практических навыков проектирования, разработки и эксплуатации агентных систем на базе больших языковых моделей. В рамках курса рассматриваются типы агентных архитектур, планирование, память, работа с инструментами, подходы к оценке качества и надежности, вопросы безопасности и наблюдаемости, а также основы обучения агентности (GRPO, DAPO, RLVR). Примеры и задания ориентированы на реальные сценарии применения в бизнес‑среде крупных организаций.
Цель освоения дисциплины
- Формирование практических навыков проектирования и эксплуатации агентных систем на базе LLM в условиях промышленной разработки.
Планируемые результаты обучения
- Владеть навыками проектирования агентных решений (планирование, память, инструменты) и их безопасного развертывания
- Уметь интегрировать внешние сервисы и API, настраивать оценку качества (offline/online) и регрессионные тесты
- Знать основы обучения агентности (GRPO, DAPO, RLVR), наблюдаемости и инцидент-менеджмента
- Умение спроектировать и реализовать базовый агент с планированием и памятью
- Навык безопасной интеграции одного инструмента и обработки отказов
- Владение базовой телеметрией (логи/трейсы) и документацией решения
- Умение собрать минимальный RL-контур GRPO для LLM-агента
- Навык проектирования простого reward и учета KL-регуляризации
- Достижение измеримого прироста task_success на валидации и корректная отчетность
Содержание учебной дисциплины
- Введение в агентов
- RAG и подходы к нему
- Методы оценки результатов агентов Offline-оценка и online-оценка
- Практические примеры
- Безопасность в агентах
- Обучение LLM агентности
Элементы контроля
- Домашняя работа 1Реализация минимального агента с планированием шагов, рабочей памятью и интеграцией одного внешнего инструмента (API/БД). Короткое демо и README.
- Домашняя работа 2Мини-агент в Google Colab с тонкой настройкой по схеме GRPO на синтетических задачах: планирование шага → вызов инструмента (calculator) → ответ. Демо и краткий отчет.
- Экзамен
Промежуточная аттестация
- 2025/2026 2nd module0.3 * Домашняя работа 1 + 0.3 * Домашняя работа 2 + 0.4 * Экзамен
Список литературы
Рекомендуемая основная литература
- Shoham, Y., & Leyton-Brown, K. (2009). Multiagent Systems : Algorithmic, Game-Theoretic, and Logical Foundations. Cambridge: Cambridge University Press. Retrieved from http://search.ebscohost.com/login.aspx?direct=true&site=eds-live&db=edsebk&AN=269245
- YU LEI, & WENJIE LI. (2019). Interactive Recommendation with User-Specific Deep Reinforcement Learning. ACM Transactions on Knowledge Discovery from Data, 13(6), 1–15. https://doi.org/10.1145/3359554
Рекомендуемая дополнительная литература
- Agent-based computational modelling : applications in demography, social,economic and environmental sciences, , 2006
- Agent-based methods in economics and finance : simulations in Swarm, , 2002
- Agent-based models, Gilbert, N., 2008
- An introduction to agent-based modeling: Modeling natural, social, and engineered complex systems..., Wilensky, U., 2015
- Artificial economics : agent-based methods in finance, game theory and their applications, , 2006