• A
  • A
  • A
  • АБB
  • АБB
  • АБB
  • А
  • А
  • А
  • А
  • А
Обычная версия сайта
2024/2025

Введение в машинное обучение

Статус: Маго-лего
Когда читается: 4 модуль
Охват аудитории: для своего кампуса
Язык: русский
Кредиты: 3

Программа дисциплины

Аннотация

Курс направлен на знакомство с концепциями машинного обучения, алгоритмами и инструментами для их практического применения. В рамках курса изучаются базовые алгоритмы регрессии, классификации, кластеризации, методы снижения размерности, способы подбора метрик, а также способы оптимизации моделей.
Цель освоения дисциплины

Цель освоения дисциплины

  • Подготовка студентов к дальнейшему изучению продвинутых курсов и применению полученных компетенций в профессиональной деятельности.
Планируемые результаты обучения

Планируемые результаты обучения

  • Получение навыка по исследованию датасета и предобработке данных для дальнейшего моделирования.
  • После изучения раздела о линейной регрессии, студенты должны понимать основные принципы её работы, включая использование метода наименьших квадратов и градиентного спуска для нахождения коэффициентов.
  • Научатся реализовывать линейную регрессию с применением стохастического градиентного спуска, а также полиномиальную регрессию для моделирования нелинейных зависимостей.
  • Смогут применять методы регуляризации (Lasso и Ridge) для улучшения обобщающей способности модели и использования различных метрик (MSE, RMSE, R², MAE, MAPE) для оценки её качества.
  • Освоят реализацию линейной регрессии в библиотеке Scikit-learn, включая визуализацию результатов и анализ эффективности модели в реальных задачах.
  • Студенты должны овладеть пониманием различных типов классификации, включая бинарную, мультиклассовую и мульти-таргет классификацию.
  • Будут знать, как применять регуляризацию в логистической регрессии для улучшения обобщающей способности модели, а также освоят методы борьбы с дисбалансом классов, такие как SMOTE, undersampling и oversampling.
  • Научатся оценивать качество модели классификации с помощью различных метрик, таких как Accuracy, Precision, Recall, ROC-AUC и F1-score, и смогут применять их для анализа эффективности моделей в реальных задачах классификации.
  • После изучения основ работы с решающими деревьями, студенты должны овладеть ключевыми понятиями, такими как узел, лист, глубина, корень и разбиение дерева, а также понимать критерии разбиения, включая Gini impurity, Entropy для классификации и MSE для регрессии.
  • Научатся подбирать гиперпараметры решающих деревьев для оптимизации их работы и смогут эффективно работать с проблемами недообучения и переобучения, используя различные методы настройки и ограничения модели для повышения её обобщающей способности.
  • После изучения методов извлечения признаков и отбора признаков, студенты должны овладеть техникой понижения размерности, включая методы отбора признаков и снижения признакового пространства.
  • Освоят различные методы отбора признаков, такие как Filter, Wrapper и Embedded, а также научатся применять продвинутые виды кросс-валидации, включая Grid Search и Random Search для оптимизации моделей.
  • Познакомятся с концепцией AutoML, что позволит им автоматизировать процесс выбора модели и гиперпараметров для повышения эффективности и точности машинного обучения.
  • После изучения ансамблевых методов, студенты должны понимать, что такое ансамбли и почему они часто показывают лучшие результаты, чем одиночные деревья.
  • Освоят принцип работы бэггинга, включая алгоритм случайного леса и бутстрап-выборку, а также научатся подбирать гиперпараметры для улучшения производительности модели.
  • Будут знакомы с бустингом, его алгоритмами, такими как AdaBoost, GradientBoost, XGBoost, LGBM и CatBoost, а также методом стекинга.
  • Смогут оценивать преимущества и недостатки ансамблей, понимать, когда их использование не оправдано, и освоят автоматизацию подбора гиперпараметров с помощью Optuna.
Содержание учебной дисциплины

Содержание учебной дисциплины

  • Основы машинного обучения
  • Линейная регрессия
  • Классификация методом логистической регрессии
  • Решающие деревья.
  • Работа над улучшением качества предсказаний моделей
  • Ансамблевые методы
Элементы контроля

Элементы контроля

  • неблокирующий ДЗ1
  • неблокирующий ДЗ2
  • неблокирующий ДЗ3
  • неблокирующий ДЗ4
  • блокирующий Экзамен
Промежуточная аттестация

Промежуточная аттестация

  • 2024/2025 4th module
    0.175 * ДЗ1 + 0.175 * ДЗ2 + 0.175 * ДЗ3 + 0.175 * ДЗ4 + 0.3 * Экзамен
Список литературы

Список литературы

Рекомендуемая основная литература

  • Лимановская, О. В. Основы машинного обучения : учебное пособие / О. В. Лимановская, Т. И. Алферьева ; Мин-во науки и высш. образования РФ. - Екатеринбург : Изд-во Уральского ун-та, 2020. - 88 с. - ISBN 978-5-7996-3015-7. - Текст : электронный. - URL: https://znanium.com/catalog/product/1960910

Рекомендуемая дополнительная литература

  • Дмитриев Егор Андреевич. (2017). Линейная регрессия. Students’ Scientific Research and Development ; № 2(4) ; 123-124 ; Научные Исследования и Разработки Студентов.

Авторы

  • Паточенко Евгений Анатольевич
  • Ахмедова Гюнай Интигам кызы