• A
  • A
  • A
  • АБB
  • АБB
  • АБB
  • А
  • А
  • А
  • А
  • А
Обычная версия сайта
Бакалавриат 2025/2026

Проектный семинар "Машинное обучение: инструменты аналитики"

Статус: Курс обязательный (Аналитика в экономике)
Когда читается: 2-й курс, 3, 4 модуль
Охват аудитории: для своего кампуса
Язык: русский
Кредиты: 3
Контактные часы: 32

Программа дисциплины

Аннотация

Этот семестровый курс является введением в инструменты машинного обучения. Среднее время освоения курса может варьироваться в зависимости от изначальной подготовки студента. Пререквизитом для освоения курса является знание математики, теории вероятности и математической статистики на уровне первого курса университета и основ языка программирования Python. Академические успехи студентов оцениваются посредством заданий на программирование в виде контестов. Итоговый экзамен представляет из себя контест с презентацией предложенных студентов способов решения. С помощью заданий курса отрабатываются базовые способы предобработки данных, построения моделей, интерпретации результатов. Курс не подразумевает проведение лекций, все теоретические материалы выдаются студентам на практических занятиях.
Цель освоения дисциплины

Цель освоения дисциплины

  • • Понимание базовых правил синтаксиса, типов данных, встроенных конструкций • Создание пайплайнов препроцессинга данных • Освоение основной библиотеки по машинному обучению на Python: sklearn • Формирование базовых навыков использования Python как инструмента классификации и прогнозирования
Планируемые результаты обучения

Планируемые результаты обучения

  • Студент способен находить и устранять синтаксические и логические ошибки в скриптах
  • Студент способен объяснить основные виды данных и постановки исследовательской задачи
  • Студент способен создавать базовые модели машинного обучения для задач регрессии и классификации, задачи кластеризации
  • Студент способен проводить анализ полученных результатов с целью описания экономических процессов
Содержание учебной дисциплины

Содержание учебной дисциплины

  • 1. Постановка задач, типы данных, Пайплайны
  • 2. Линейная регрессия
  • 3. Полиномиальная модель/ Стохастический градиентный спуск/ Квантильная регрессия
  • 4. KNN
  • 5. Ridge/Lasso/ElasticNet
  • 6. Введение в задачу классификации, Логистическая регрессия
  • 7. KNN/SVM
  • 8. Gaussian Process/Naive Bayess
  • 9. Деревья/ансамбли
  • 10. Несбалансированность
  • 11. Мультикласс
  • 12. Метрики задач кластеризации/скейлинг/нормализация
  • 13. T-sne/PCA
  • 14. MLP
  • 15. Confident Learning/Active Learning
  • 16. Предзащита проекта
Элементы контроля

Элементы контроля

  • неблокирующий Контест 1
    Контест 1 представляет из себя соревнование на площадке Kaggle для студентов курса. Задачей студентов является получение правильных ответов на задачи предсказания, загружаемых на сайт. Чтобы получить правильные ответы на задачу предсказания, студент должен построить модель машинного обучения, применив знания с пройденных тем курса. Количество попыток студента не ограничено до истечения времени проведения элемента контроля. Студентам запрещается делиться решениями. После загрузки, результат студента отражается на лидерборде.
  • неблокирующий Контест 2
    Контест 2 представляет из себя соревнование на площадке Kaggle для студентов курса. Задачей студентов является получение правильных ответов на задачи предсказания, загружаемых на сайт. Чтобы получить правильные ответы на задачу предсказания, студент должен построить модель машинного обучения, применив знания с пройденных тем курса. Количество попыток студента не ограничено до истечения времени проведения элемента контроля. Студентам запрещается делиться решениями. После загрузки решения, результат студента отражается на лидерборде.
  • неблокирующий Контест 3
    Контест 2 представляет из себя соревнование на площадке Kaggle для студентов курса. Задачей студентов является получение правильных ответов на задачи предсказания, загружаемых на сайт. Чтобы получить правильные ответы на задачу предсказания, студент должен построить модель машинного обучения, применив знания с пройденных тем курса. Количество попыток студента не ограничено до истечения времени проведения элемента контроля. Студентам запрещается делиться решениями. После загрузки решения, результат студента отражается на лидерборде.
  • неблокирующий Защита курсового проекта
    Студенты в командах до 6 человек презентуют результаты курсового проекта по материалам дисциплины. В начале курса студентам предоставляется датасет с задачей построения модели машинного обучения. Студенты презентуют результаты своего анализа данных и построения моделей во время сессии с целью продемонстрировать результаты прикладного проекта по анализу данных.
  • неблокирующий Предзащита курсового проекта
    Студенты в командах до 6 человек презентуют результаты курсового проекта по материалам дисциплины. В начале курса студентам предоставляется датасет с задачей построения модели машинного обучения. Студенты презентуют результаты своего анализа данных и построения моделей на одном из семинаров в конце курса с целью продемонстрировать прогресс по курсовому проекту.
Промежуточная аттестация

Промежуточная аттестация

  • 2025/2026 4th module
    0.3 * Защита курсового проекта + 0.1 * Контест 1 + 0.2 * Контест 2 + 0.2 * Контест 3 + 0.2 * Предзащита курсового проекта
Список литературы

Список литературы

Рекомендуемая основная литература

  • Python для сложных задач : наука о данных и машинное обучение, Плас, Дж. В., 2018

Рекомендуемая дополнительная литература

  • Машинное обучение с помощью Python : руководство для специалистов по работе с данными, Мюллер, А., 2022

Авторы

  • Бродская Наталья Николаевна