Машинное обучение и безопасность систем

Магистратура 2024/2025

Статус: Курс обязательный (Информационная безопасность и технологии искусственного интеллекта)

Кто читает: Кафедра информационной безопасности киберфизических систем

Когда читается: 1-й курс, 3, 4 модуль

Охват аудитории: для своего кампуса

Преподаватели: Андреева Дарья Александровна

Язык: русский

Полная версия программы учебной дисциплины Задать вопрос

Аннотация

Курс посвящен изучению современных методов машинного обучения (ML) и основ безопасности искусственного интеллекта (AI Safety). Студенты познакомятся с ключевыми идеями и алгоритмами ML, а также с теоретическими и практическими аспектами обеспечения безопасности и надежности AI-систем. В рамках курса будут рассмотрены вопросы управления системами и рисками, связанные с ними, а также обнаружение уязвимостей, интерпретируемость моделей и поддержание систем, использующих AI.

Цель освоения дисциплины

Ознакомление с основными методами эксплоративного анализа данных.
Формирование навыков разработки систем машинного обучения.
Формирование навыков исследования систем машинного обучения с точки зрения бизнеса и науки.

Планируемые результаты обучения

Определяет основные понятия и задачи машинного обучения
Различает виды задач и понимает, где нужно какую использовать
Определяет цели и задачи эксплоративного анализа данных
Выполняет предварительную обработку данных (очистка, трансформация, устранение пропусков)
Проводит визуализацию данных для выявления закономерностей и аномалий
Применяет методы описательной статистики для анализа распределений и взаимосвязей
Интерпретирует результаты эксплоративного анализа данных и формулирует гипотезы
Оценивает параметры линейной регрессии методом наименьших квадратов
Анализирует качество линейных моделей с использованием метрик (MAE, MSE, R²)
Корректно подбирает метрику под решаемую задачу
Проводит регуляризацию линейных моделей (Ridge, Lasso) для предотвращения переобучения и понимает, зачем это нужно
Интерпретирует параметры линейных моделей и их значимость
Обучает решающие деревья на основе критерия разбиения (Gini, энтропия, MSE)
Выполняет настройку гиперпараметров решающих деревьев (глубина, минимальное число объектов в узле)
Анализирует переобучение и недообучение решающих деревьев
Интерпретирует структуру дерева решений и значимость признаков
Создаёт архитектуру нейронной сети (полносвязные, сверточные, рекуррентные слои и т.д.) и понимает, для чего используется каждая
Выполняет настройку гиперпараметров нейронной сети (число слоёв, нейронов, скорость обучения)
Обучает нейронные сети с использованием оптимизаторов (SGD, Adam) и функций потерь
Применяет модели векторного представления текста (TF-IDF, word2vec, BERT)
Решает задачи классификации, кластеризации и поиска по тексту
Понимает, для чего используется каждая модель и интерпретирует результаты
Выполняет предварительную обработку изображений (нормализация, масштабирование, аугментация)
Применяет свёрточные нейронные сети (CNN) для извлечения признаков и классификации изображений
Решает задачи сегментации, распознавания объектов и восстановления изображений
Анализирует вклад признаков с помощью методов интерпретации (SHAP, LIME)
Использует упрощённые модели (линейные модели, деревья решений) для интерпретации сложных моделей
Визуализирует важность признаков и влияние отдельных переменных на прогноз
Оценивает устойчивость моделей к выбросам, шуму и изменениям в данных
Проводит атаки на модели (adversarial attacks) для выявления уязвимостей
Применяет методы повышения робастности (дополнительные регуляризации, adversarial training)

Содержание учебной дисциплины

1. Введение в дисциплину
2. Эксплоративный анализ данных
3. Линейные модели
4. Решающие деревья
5. Нейронные сети
6. Анализ текстов
7. Работа с изображениями
8. Интерпретируемость моделей
9. Робастность моделей и уязвимости

Элементы контроля

Опрос на занятиях
Практические работы
Контрольные работы
Экзамен
Итоговый экзамен по дисциплине проводится в форме пиьсменного экзамена в конце изучения курса в присутствии преподавателя. На экзамене студент получает формуляр с заданиями экзамена, которые должен решить и сдать на проверку в течение 2 (двух) академических часов.

Промежуточная аттестация

2024/2025 4th module
0.15 * Контрольные работы + 0.15 * Опрос на занятиях + 0.4 * Практические работы + 0.3 * Экзамен

Список литературы

Авторы

Евсютин Олег Олегович
Андреева Дарья Александровна
Аксенова Ольга Вениаминовна

Программа дисциплины