• A
  • A
  • A
  • АБB
  • АБB
  • АБB
  • А
  • А
  • А
  • А
  • А
Обычная версия сайта
2025/2026

Практическое применение агентских систем

Статус: Маго-лего
Когда читается: 2 модуль
Охват аудитории: для своего кампуса
Язык: русский
Кредиты: 3
Контактные часы: 28

Программа дисциплины

Аннотация

Дисциплина направлена на формирование практических навыков проектирования, разработки и эксплуатации агентных систем на базе больших языковых моделей. В рамках курса рассматриваются типы агентных архитектур, планирование, память, работа с инструментами, подходы к оценке качества и надежности, вопросы безопасности и наблюдаемости, а также основы обучения агентности (GRPO, DAPO, RLVR). Примеры и задания ориентированы на реальные сценарии применения в бизнес‑среде крупных организаций.
Цель освоения дисциплины

Цель освоения дисциплины

  • Формирование практических навыков проектирования и эксплуатации агентных систем на базе LLM в условиях промышленной разработки.
Планируемые результаты обучения

Планируемые результаты обучения

  • Владеть навыками проектирования агентных решений (планирование, память, инструменты) и их безопасного развертывания
  • Уметь интегрировать внешние сервисы и API, настраивать оценку качества (offline/online) и регрессионные тесты
  • Знать основы обучения агентности (GRPO, DAPO, RLVR), наблюдаемости и инцидент-менеджмента
  • Умение спроектировать и реализовать базовый агент с планированием и памятью
  • Навык безопасной интеграции одного инструмента и обработки отказов
  • Владение базовой телеметрией (логи/трейсы) и документацией решения
  • Умение собрать минимальный RL-контур GRPO для LLM-агента
  • Навык проектирования простого reward и учета KL-регуляризации
  • Достижение измеримого прироста task_success на валидации и корректная отчетность
Содержание учебной дисциплины

Содержание учебной дисциплины

  • Введение в агентов
  • RAG и подходы к нему
  • Методы оценки результатов агентов Offline-оценка и online-оценка
  • Практические примеры
  • Безопасность в агентах
  • Обучение LLM агентности
Элементы контроля

Элементы контроля

  • неблокирующий Домашняя работа 1
    Реализация минимального агента с планированием шагов, рабочей памятью и интеграцией одного внешнего инструмента (API/БД). Короткое демо и README.
  • неблокирующий Домашняя работа 2
    Мини-агент в Google Colab с тонкой настройкой по схеме GRPO на синтетических задачах: планирование шага → вызов инструмента (calculator) → ответ. Демо и краткий отчет.
  • неблокирующий Экзамен
Промежуточная аттестация

Промежуточная аттестация

  • 2025/2026 2nd module
    0.3 * Домашняя работа 1 + 0.3 * Домашняя работа 2 + 0.4 * Экзамен
Список литературы

Список литературы

Рекомендуемая основная литература

  • Shoham, Y., & Leyton-Brown, K. (2009). Multiagent Systems : Algorithmic, Game-Theoretic, and Logical Foundations. Cambridge: Cambridge University Press. Retrieved from http://search.ebscohost.com/login.aspx?direct=true&site=eds-live&db=edsebk&AN=269245
  • YU LEI, & WENJIE LI. (2019). Interactive Recommendation with User-Specific Deep Reinforcement Learning. ACM Transactions on Knowledge Discovery from Data, 13(6), 1–15. https://doi.org/10.1145/3359554

Рекомендуемая дополнительная литература

  • Agent-based computational modelling : applications in demography, social,economic and environmental sciences, , 2006
  • Agent-based methods in economics and finance : simulations in Swarm, , 2002
  • Agent-based models, Gilbert, N., 2008
  • An introduction to agent-based modeling: Modeling natural, social, and engineered complex systems..., Wilensky, U., 2015
  • Artificial economics : agent-based methods in finance, game theory and their applications, , 2006

Авторы

  • Емашева Валерия Анатольевна