Магистратура
2024/2025





Машинное обучение и безопасность систем
Статус:
Курс обязательный (Информационная безопасность и технологии искусственного интеллекта)
Когда читается:
1-й курс, 3, 4 модуль
Охват аудитории:
для своего кампуса
Преподаватели:
Андреева Дарья Александровна
Язык:
русский
Программа дисциплины
Аннотация
Курс посвящен изучению современных методов машинного обучения (ML) и основ безопасности искусственного интеллекта (AI Safety). Студенты познакомятся с ключевыми идеями и алгоритмами ML, а также с теоретическими и практическими аспектами обеспечения безопасности и надежности AI-систем. В рамках курса будут рассмотрены вопросы управления системами и рисками, связанные с ними, а также обнаружение уязвимостей, интерпретируемость моделей и поддержание систем, использующих AI.
Цель освоения дисциплины
- Ознакомление с основными методами эксплоративного анализа данных.
- Формирование навыков разработки систем машинного обучения.
- Формирование навыков исследования систем машинного обучения с точки зрения бизнеса и науки.
Планируемые результаты обучения
- Определяет основные понятия и задачи машинного обучения
- Различает виды задач и понимает, где нужно какую использовать
- Определяет цели и задачи эксплоративного анализа данных
- Выполняет предварительную обработку данных (очистка, трансформация, устранение пропусков)
- Проводит визуализацию данных для выявления закономерностей и аномалий
- Применяет методы описательной статистики для анализа распределений и взаимосвязей
- Интерпретирует результаты эксплоративного анализа данных и формулирует гипотезы
- Оценивает параметры линейной регрессии методом наименьших квадратов
- Анализирует качество линейных моделей с использованием метрик (MAE, MSE, R²)
- Корректно подбирает метрику под решаемую задачу
- Проводит регуляризацию линейных моделей (Ridge, Lasso) для предотвращения переобучения и понимает, зачем это нужно
- Интерпретирует параметры линейных моделей и их значимость
- Обучает решающие деревья на основе критерия разбиения (Gini, энтропия, MSE)
- Выполняет настройку гиперпараметров решающих деревьев (глубина, минимальное число объектов в узле)
- Анализирует переобучение и недообучение решающих деревьев
- Интерпретирует структуру дерева решений и значимость признаков
- Создаёт архитектуру нейронной сети (полносвязные, сверточные, рекуррентные слои и т.д.) и понимает, для чего используется каждая
- Выполняет настройку гиперпараметров нейронной сети (число слоёв, нейронов, скорость обучения)
- Обучает нейронные сети с использованием оптимизаторов (SGD, Adam) и функций потерь
- Применяет модели векторного представления текста (TF-IDF, word2vec, BERT)
- Решает задачи классификации, кластеризации и поиска по тексту
- Понимает, для чего используется каждая модель и интерпретирует результаты
- Выполняет предварительную обработку изображений (нормализация, масштабирование, аугментация)
- Применяет свёрточные нейронные сети (CNN) для извлечения признаков и классификации изображений
- Решает задачи сегментации, распознавания объектов и восстановления изображений
- Анализирует вклад признаков с помощью методов интерпретации (SHAP, LIME)
- Использует упрощённые модели (линейные модели, деревья решений) для интерпретации сложных моделей
- Визуализирует важность признаков и влияние отдельных переменных на прогноз
- Оценивает устойчивость моделей к выбросам, шуму и изменениям в данных
- Проводит атаки на модели (adversarial attacks) для выявления уязвимостей
- Применяет методы повышения робастности (дополнительные регуляризации, adversarial training)
Содержание учебной дисциплины
- 1. Введение в дисциплину
- 2. Эксплоративный анализ данных
- 3. Линейные модели
- 4. Решающие деревья
- 5. Нейронные сети
- 6. Анализ текстов
- 7. Работа с изображениями
- 8. Интерпретируемость моделей
- 9. Робастность моделей и уязвимости
Элементы контроля
- Опрос на занятиях
- Практические работы
- Контрольные работы
- ЭкзаменИтоговый экзамен по дисциплине проводится в форме пиьсменного экзамена в конце изучения курса в присутствии преподавателя. На экзамене студент получает формуляр с заданиями экзамена, которые должен решить и сдать на проверку в течение 2 (двух) академических часов.
Промежуточная аттестация
- 2024/2025 4th module0.15 * Контрольные работы + 0.15 * Опрос на занятиях + 0.4 * Практические работы + 0.3 * Экзамен
Список литературы
Рекомендуемая основная литература
- Christopher M. Bishop. (n.d.). Australian National University Pattern Recognition and Machine Learning. Retrieved from http://search.ebscohost.com/login.aspx?direct=true&site=eds-live&db=edsbas&AN=edsbas.EBA0C705
- Hastie, T., Tibshirani, R., & Friedman, J. H. (2009). The Elements of Statistical Learning : Data Mining, Inference, and Prediction (Vol. Second edition, corrected 7th printing). New York: Springer. Retrieved from http://search.ebscohost.com/login.aspx?direct=true&site=eds-live&db=edsebk&AN=277008
- Manning C. D., Schutze H. Foundations of statistical natural processing. – 1999. – 719 pp.
Рекомендуемая дополнительная литература
- Stephen Boyd, Lieven Vandenberghe, & Lieven V. (2015). Additional Exercises for Convex Optimization. Retrieved from http://search.ebscohost.com/login.aspx?direct=true&site=eds-live&db=edsbas&AN=edsbas.E7445CE1