Бакалавриат
2025/2026




Проектный семинар "Машинное обучение: инструменты аналитики"
Статус:
Курс обязательный (Аналитика в экономике)
Кто читает:
Департамент экономики
Где читается:
Санкт-Петербургская школа экономики и менеджмента
Когда читается:
2-й курс, 3, 4 модуль
Охват аудитории:
для своего кампуса
Преподаватели:
Ефимов Константин Дмитриевич
Язык:
русский
Кредиты:
3
Контактные часы:
32
Программа дисциплины
Аннотация
Этот семестровый курс является введением в инструменты машинного обучения. Среднее время освоения курса может варьироваться в зависимости от изначальной подготовки студента. Пререквизитом для освоения курса является знание математики, теории вероятности и математической статистики на уровне первого курса университета и основ языка программирования Python. Академические успехи студентов оцениваются посредством заданий на программирование в виде контестов. Итоговый экзамен представляет из себя контест с презентацией предложенных студентов способов решения. С помощью заданий курса отрабатываются базовые способы предобработки данных, построения моделей, интерпретации результатов. Курс не подразумевает проведение лекций, все теоретические материалы выдаются студентам на практических занятиях.
Цель освоения дисциплины
- • Понимание базовых правил синтаксиса, типов данных, встроенных конструкций • Создание пайплайнов препроцессинга данных • Освоение основной библиотеки по машинному обучению на Python: sklearn • Формирование базовых навыков использования Python как инструмента классификации и прогнозирования
Планируемые результаты обучения
- Студент способен находить и устранять синтаксические и логические ошибки в скриптах
- Студент способен объяснить основные виды данных и постановки исследовательской задачи
- Студент способен создавать базовые модели машинного обучения для задач регрессии и классификации, задачи кластеризации
- Студент способен проводить анализ полученных результатов с целью описания экономических процессов
Содержание учебной дисциплины
- 1. Постановка задач, типы данных, Пайплайны
- 2. Линейная регрессия
- 3. Полиномиальная модель/ Стохастический градиентный спуск/ Квантильная регрессия
- 4. KNN
- 5. Ridge/Lasso/ElasticNet
- 6. Введение в задачу классификации, Логистическая регрессия
- 7. KNN/SVM
- 8. Gaussian Process/Naive Bayess
- 9. Деревья/ансамбли
- 10. Несбалансированность
- 11. Мультикласс
- 12. Метрики задач кластеризации/скейлинг/нормализация
- 13. T-sne/PCA
- 14. MLP
- 15. Confident Learning/Active Learning
- 16. Предзащита проекта
Элементы контроля
- Контест 1Контест 1 представляет из себя соревнование на площадке Kaggle для студентов курса. Задачей студентов является получение правильных ответов на задачи предсказания, загружаемых на сайт. Чтобы получить правильные ответы на задачу предсказания, студент должен построить модель машинного обучения, применив знания с пройденных тем курса. Количество попыток студента не ограничено до истечения времени проведения элемента контроля. Студентам запрещается делиться решениями. После загрузки, результат студента отражается на лидерборде.
- Контест 2Контест 2 представляет из себя соревнование на площадке Kaggle для студентов курса. Задачей студентов является получение правильных ответов на задачи предсказания, загружаемых на сайт. Чтобы получить правильные ответы на задачу предсказания, студент должен построить модель машинного обучения, применив знания с пройденных тем курса. Количество попыток студента не ограничено до истечения времени проведения элемента контроля. Студентам запрещается делиться решениями. После загрузки решения, результат студента отражается на лидерборде.
- Контест 3Контест 2 представляет из себя соревнование на площадке Kaggle для студентов курса. Задачей студентов является получение правильных ответов на задачи предсказания, загружаемых на сайт. Чтобы получить правильные ответы на задачу предсказания, студент должен построить модель машинного обучения, применив знания с пройденных тем курса. Количество попыток студента не ограничено до истечения времени проведения элемента контроля. Студентам запрещается делиться решениями. После загрузки решения, результат студента отражается на лидерборде.
- Защита курсового проектаСтуденты в командах до 6 человек презентуют результаты курсового проекта по материалам дисциплины. В начале курса студентам предоставляется датасет с задачей построения модели машинного обучения. Студенты презентуют результаты своего анализа данных и построения моделей во время сессии с целью продемонстрировать результаты прикладного проекта по анализу данных.
- Предзащита курсового проектаСтуденты в командах до 6 человек презентуют результаты курсового проекта по материалам дисциплины. В начале курса студентам предоставляется датасет с задачей построения модели машинного обучения. Студенты презентуют результаты своего анализа данных и построения моделей на одном из семинаров в конце курса с целью продемонстрировать прогресс по курсовому проекту.
Промежуточная аттестация
- 2025/2026 4th module0.3 * Защита курсового проекта + 0.1 * Контест 1 + 0.2 * Контест 2 + 0.2 * Контест 3 + 0.2 * Предзащита курсового проекта