Бакалавриат
2024/2025





Современные методы анализа данных и машинного обучения
Статус:
Курс обязательный (Бизнес-информатика)
Направление:
38.03.05. Бизнес-информатика
Где читается:
Высшая школа бизнеса
Когда читается:
3-й курс, 3, 4 модуль
Формат изучения:
с онлайн-курсом
Онлайн-часы:
50
Охват аудитории:
для своего кампуса
Язык:
русский
Кредиты:
7
Программа дисциплины
Аннотация
Данный курс посвящен изучению основ аналитики данных; построению визуализаций; разработке и проверке продуктовых гипотез и проведению продуктовых исследований; освоению элементов дата-инжиниринга; изучению классического и глубинного машинного обучения, включая математику машинного обучения и методы математической статистики в анализе данных; проведению А/В-тестирований; разработке рекомендательных систем, а также большим языковым моделям (LLM). В контексте курса делается упор на техническую и аналитическую составляющую с подробным обсуждением специализированных библиотек для работы с данными. Все темы и блоки в рамках курса рассматриваются на примере реализации реальных бизнес-задач, что таким образом еще сильнее расширяет прикладную значимость материала.
Цель освоения дисциплины
- Уверенное владение языком программирования Python на базовом уровне для решения задач аналитики. Умение применять специальные библиотеки Numpy, Pandas для анализа бизнес-данных
- Выработка навыков осуществления первичного анализа данных, построения визуализаций данных и их интерпретация
- Знакомство с основными продуктовыми гипотезами, продуктовыми метриками. Умение их применять при решении бизнес-задач на практике
- Ознакомление с принципами извлечения данных с внешних ресурсов и обработки полученных данных
- Проработка математической основы использования машинного обучения, применение линейной алгебры и математического анализа для осуществления алгоритмов
- Знакомство с машинным обучением в контексте задач классического машинного обучения
- Знакомство с понятием временных рядов, в том числе неоднородных временных рядов, и умение использовать модели анализа временных данных для решения прикладных задач
- Изучение принципов глубинного обучения и применения их на практике для решения бизнес-задач
Планируемые результаты обучения
- Уметь применять подходы математической статистики для решения бизнес-задач
- Уметь работать и анализировать данные, имеющие временную отметку
- Уметь применять алгоритмы временных рядов на реальных данных
- Уметь отличать однородные и неоднородные временные ряды
- Уметь работать с неоднородными временными рядами, применять алгоритмы анализа и прогнозирования неоднородных временных рядов
- Владеть основами синтаксиса библиотек Matplotlib, Seaborn
- Строить простейшие визуализации данных
- Применять на практике основы EDA, осуществлять разведочный анализ данных
- Работать с интерактивными визуализациями
- Уметь вычислять и анализировать продуктовые метрики
- Уметь строить и проверять продуктовые гипотезы
- Осуществлять парсинг данных с внешних ресурсов
- Работать с API внешних ресурсов
- Уметь применять знания линейной алгебры в Python
- Уметь применять знания математического анализа в Python
- Использовать математический анализ и линейную алгебру для математического обоснования и оптимизации решений задач машинного обучения
- Уметь применять машинное обучение для решения задач анализа данных
- Дифференцировать методы машинного обучения по типам решаемых задач, метрикам качества, функциям ошибки, применять методы машинного обучения на практике
- Решать задачи кластеризации на практике с использованием методов машинного обучения
- Уметь применять нейронные сети для решения различных задач машинного обучения
- Уметь создавать и настраивать рекомендательную систему на основе данных
- Применять методы MLOps для внедрения алгоритмов машинного обучения
Содержание учебной дисциплины
- Задачи анализа данных, аналитики, основы EDA
- Продуктовые гипотезы, продуктовые метрики
- Извлечение данных
- Математическая статистика в анализе данных
- Классическое машинное обучение
- Математика для машинного обучения
- Рекомендательные системы
- Анализ и прогнозирование временных рядов
- Глубинное обучение
- MLOps
Элементы контроля
- ДЗСредняя оценка за все практические домашние задания, предусмотренные на курсе
- ГПСредняя оценка за все практические групповые инициативные проекты, предусмотренные на курсе
- АктивностьОценивание посещения и активности студента на семинарах, а также активности на лекциях
- КР-1Контрольная работа представляет собой проверочный элемент контроля, выполняемый студентами по результатам освоения первой трети курса
- КР-2Контрольная работа представляет собой проверочный элемент контроля, выполняемый студентами по результатам освоения второй трети курса
- ПроектОценка за практический проект по неоднородным временным рядам, выполняющийся в классе
- ЭкзаменЭкзамен представляет собой практическую работу, выполняемую студентами по результатам освоения курса
Промежуточная аттестация
- 2024/2025 4th module0.2 * Активность + 0.2 * ГП + 0.1 * ДЗ + 0.1 * КР-1 + 0.1 * КР-2 + 0.05 * Проект + 0.25 * Экзамен
Список литературы
Рекомендуемая основная литература
- Noah Gift, & Alfredo Deza. (2021). Practical MLOps: Vol. First edition. O’Reilly Media.
- Pandas for everyone : Python data analysis, Chen, D. Y., 2023
- Python для сложных задач: наука о данных и машинное обучение : пер. с англ., Плас, Дж. Вандер, 2019
- Анализ временных рядов и прогнозирование : учебник для вузов, Афанасьев, В. Н., 2010
- Анализ данных : Статистические и вычислительные методы для научных работников и инженеров, Брандт, З., 2003
- Анализ социальных медиа на Python : извлекайте и анализируйте данные из всех уголков социальной паутины на Python, Бонцанини, М., 2018
- Введение в машинное обучение с помощью Python : руководство для специалистов по работе с данными, Мюллер, А., 2018
- Дифференциальное исчисление и исследование функций многих переменных : Учебное пособие, Михайлова, И.Г., 2014
- Когнитивная бизнес-аналитика : учеб. пособие для вузов, Абдикеев, Н. М., 2012
- Линейная алгебра и функции многих переменных : учеб. пособие для физ. специальностей ун-тов, Булдырев, В. С., 1985
- Нейронные сети. Полный курс : пер. с англ., Хайкин, С., 2018
- Фальк, К. Рекомендательные системы на практике : руководство / К. Фальк , перевод с английского Д. М. Павлова. — Москва : ДМК Пресс, 2020. — 448 с. — ISBN 978-5-97060-774-9. — Текст : электронный // Лань : электронно-библиотечная система. — URL: https://e.lanbook.com/book/179458 (дата обращения: 00.00.0000). — Режим доступа: для авториз. пользователей.
- Фракталы и хаос в динамических системах : учеб. пособие, Кроновер, Р. М., 2006
Рекомендуемая дополнительная литература
- Good charts : the HBR guide to making smarter, more persuasive data visualizations, Berinato, S., 2016
- Visualizations and dashboards for learning analytics, , 2021
- Бизнес-аналитика: от данных к знаниям : учеб. пособие, Паклин Н.Б., Орешков В.И., 2010
- Большие данные в образовании: анализ данных как основание принятия управленческих решений : сб. науч. ст. I Международной конференции, 15 окт. 2020 г., Москва, , 2020
- Вся высшая математика. Т.5: Теория вероятностей; Математическая статистика; Теория игр, Краснов, М. Л., 2014
- Загорулько, Ю. А. Искусственный интеллект. Инженерия знаний : учебное пособие для вузов / Ю. А. Загорулько, Г. Б. Загорулько. — Москва : Издательство Юрайт, 2024. — 93 с. — (Высшее образование). — ISBN 978-5-534-07198-6. — Текст : электронный // Образовательная платформа Юрайт [сайт]. — URL: https://urait.ru/bcode/540987 (дата обращения: 27.08.2024).
- Захарова, О. И. Базы данных: методические указания к лабораторным занятиям для бакалавров по направлениям подготовки 38.03.05 – «Бизнес – информатика», 27.03.04 – «Управление в технических системах», 09.03.04 – «Программная инженерия» по дисциплине «Базы данных» : методические указания / О. И. Захарова, С. Г. Бедняк. — Самара : ПГУТИ, 2018 — Часть 2 — 2018. — 60 с. — Текст : электронный // Лань : электронно-библиотечная система. — URL: https://e.lanbook.com/book/182256 (дата обращения: 00.00.0000). — Режим доступа: для авториз. пользователей.
- Интеллектуальные технологии управления. Искусственные нейронные сети и нечеткая логика, Усков, А. А., 2004
- Искусственные нейронные сети : теория и практика, Круглов, В. В., 2002
- Краткий курс математического анализа. Т.2: Дифференциальное и интегральное исчисления функций многих переменных. Гармонический анализ, Кудрявцев, Л. Д., 2008
- Машинное обучение : наука и искусство построения алгоритмов, которые извлекают знания из данных, Флах, П., 2015
- Случайные процессы : краткий курс : учеб. пособие для вузов, Розанов, Ю. А., 1979
- Случайные процессы с независимыми приращениями, Скороход, А. В., 1986
- Сорокин, А. Б. Рекомендательные системы: анамнестические и модельные методы : учебно-методическое пособие / А. Б. Сорокин, Л. М. Железняк, Р. Э. Семенов. — Москва : РТУ МИРЭА, 2022. — 65 с. — Текст : электронный // Лань : электронно-библиотечная система. — URL: https://e.lanbook.com/book/265739 (дата обращения: 00.00.0000). — Режим доступа: для авториз. пользователей.