• A
  • A
  • A
  • АБB
  • АБB
  • АБB
  • А
  • А
  • А
  • А
  • А
Обычная версия сайта
Бакалавриат 2024/2025

Современные методы анализа данных и машинного обучения

Статус: Курс обязательный (Бизнес-информатика)
Направление: 38.03.05. Бизнес-информатика
Когда читается: 3-й курс, 3, 4 модуль
Формат изучения: с онлайн-курсом
Онлайн-часы: 50
Охват аудитории: для своего кампуса
Язык: русский
Кредиты: 7

Программа дисциплины

Аннотация

Данный курс посвящен изучению основ аналитики данных; построению визуализаций; разработке и проверке продуктовых гипотез и проведению продуктовых исследований; освоению элементов дата-инжиниринга; изучению классического и глубинного машинного обучения, включая математику машинного обучения и методы математической статистики в анализе данных; проведению А/В-тестирований; разработке рекомендательных систем, а также большим языковым моделям (LLM). В контексте курса делается упор на техническую и аналитическую составляющую с подробным обсуждением специализированных библиотек для работы с данными. Все темы и блоки в рамках курса рассматриваются на примере реализации реальных бизнес-задач, что таким образом еще сильнее расширяет прикладную значимость материала.
Цель освоения дисциплины

Цель освоения дисциплины

  • Уверенное владение языком программирования Python на базовом уровне для решения задач аналитики. Умение применять специальные библиотеки Numpy, Pandas для анализа бизнес-данных
  • Выработка навыков осуществления первичного анализа данных, построения визуализаций данных и их интерпретация
  • Знакомство с основными продуктовыми гипотезами, продуктовыми метриками. Умение их применять при решении бизнес-задач на практике
  • Ознакомление с принципами извлечения данных с внешних ресурсов и обработки полученных данных
  • Проработка математической основы использования машинного обучения, применение линейной алгебры и математического анализа для осуществления алгоритмов
  • Знакомство с машинным обучением в контексте задач классического машинного обучения
  • Знакомство с понятием временных рядов, в том числе неоднородных временных рядов, и умение использовать модели анализа временных данных для решения прикладных задач
  • Изучение принципов глубинного обучения и применения их на практике для решения бизнес-задач
Планируемые результаты обучения

Планируемые результаты обучения

  • Уметь применять подходы математической статистики для решения бизнес-задач
  • Уметь работать и анализировать данные, имеющие временную отметку
  • Уметь применять алгоритмы временных рядов на реальных данных
  • Уметь отличать однородные и неоднородные временные ряды
  • Уметь работать с неоднородными временными рядами, применять алгоритмы анализа и прогнозирования неоднородных временных рядов
  • Владеть основами синтаксиса библиотек Matplotlib, Seaborn
  • Строить простейшие визуализации данных
  • Применять на практике основы EDA, осуществлять разведочный анализ данных
  • Работать с интерактивными визуализациями
  • Уметь вычислять и анализировать продуктовые метрики
  • Уметь строить и проверять продуктовые гипотезы
  • Осуществлять парсинг данных с внешних ресурсов
  • Работать с API внешних ресурсов
  • Уметь применять знания линейной алгебры в Python
  • Уметь применять знания математического анализа в Python
  • Использовать математический анализ и линейную алгебру для математического обоснования и оптимизации решений задач машинного обучения
  • Уметь применять машинное обучение для решения задач анализа данных
  • Дифференцировать методы машинного обучения по типам решаемых задач, метрикам качества, функциям ошибки, применять методы машинного обучения на практике
  • Решать задачи кластеризации на практике с использованием методов машинного обучения
  • Уметь применять нейронные сети для решения различных задач машинного обучения
  • Уметь создавать и настраивать рекомендательную систему на основе данных
  • Применять методы MLOps для внедрения алгоритмов машинного обучения
Содержание учебной дисциплины

Содержание учебной дисциплины

  • Задачи анализа данных, аналитики, основы EDA
  • Продуктовые гипотезы, продуктовые метрики
  • Извлечение данных
  • Математическая статистика в анализе данных
  • Классическое машинное обучение
  • Математика для машинного обучения
  • Рекомендательные системы
  • Анализ и прогнозирование временных рядов
  • Глубинное обучение
  • MLOps
Элементы контроля

Элементы контроля

  • неблокирующий ДЗ
    Средняя оценка за все практические домашние задания, предусмотренные на курсе
  • неблокирующий ГП
    Средняя оценка за все практические групповые инициативные проекты, предусмотренные на курсе
  • неблокирующий Активность
    Оценивание посещения и активности студента на семинарах, а также активности на лекциях
  • неблокирующий КР-1
    Контрольная работа представляет собой проверочный элемент контроля, выполняемый студентами по результатам освоения первой трети курса
  • неблокирующий КР-2
    Контрольная работа представляет собой проверочный элемент контроля, выполняемый студентами по результатам освоения второй трети курса
  • неблокирующий Проект
    Оценка за практический проект по неоднородным временным рядам, выполняющийся в классе
  • неблокирующий Экзамен
    Экзамен представляет собой практическую работу, выполняемую студентами по результатам освоения курса
Промежуточная аттестация

Промежуточная аттестация

  • 2024/2025 4th module
    0.2 * Активность + 0.2 * ГП + 0.1 * ДЗ + 0.1 * КР-1 + 0.1 * КР-2 + 0.05 * Проект + 0.25 * Экзамен
Список литературы

Список литературы

Рекомендуемая основная литература

  • Noah Gift, & Alfredo Deza. (2021). Practical MLOps: Vol. First edition. O’Reilly Media.
  • Pandas for everyone : Python data analysis, Chen, D. Y., 2023
  • Python для сложных задач: наука о данных и машинное обучение : пер. с англ., Плас, Дж. Вандер, 2019
  • Анализ временных рядов и прогнозирование : учебник для вузов, Афанасьев, В. Н., 2010
  • Анализ данных : Статистические и вычислительные методы для научных работников и инженеров, Брандт, З., 2003
  • Анализ социальных медиа на Python : извлекайте и анализируйте данные из всех уголков социальной паутины на Python, Бонцанини, М., 2018
  • Введение в машинное обучение с помощью Python : руководство для специалистов по работе с данными, Мюллер, А., 2018
  • Дифференциальное исчисление и исследование функций многих переменных : Учебное пособие, Михайлова, И.Г., 2014
  • Когнитивная бизнес-аналитика : учеб. пособие для вузов, Абдикеев, Н. М., 2012
  • Линейная алгебра и функции многих переменных : учеб. пособие для физ. специальностей ун-тов, Булдырев, В. С., 1985
  • Нейронные сети. Полный курс : пер. с англ., Хайкин, С., 2018
  • Фальк, К. Рекомендательные системы на практике : руководство / К. Фальк , перевод с английского Д. М. Павлова. — Москва : ДМК Пресс, 2020. — 448 с. — ISBN 978-5-97060-774-9. — Текст : электронный // Лань : электронно-библиотечная система. — URL: https://e.lanbook.com/book/179458 (дата обращения: 00.00.0000). — Режим доступа: для авториз. пользователей.
  • Фракталы и хаос в динамических системах : учеб. пособие, Кроновер, Р. М., 2006

Рекомендуемая дополнительная литература

  • Good charts : the HBR guide to making smarter, more persuasive data visualizations, Berinato, S., 2016
  • Visualizations and dashboards for learning analytics, , 2021
  • Бизнес-аналитика: от данных к знаниям : учеб. пособие, Паклин Н.Б., Орешков В.И., 2010
  • Большие данные в образовании: анализ данных как основание принятия управленческих решений : сб. науч. ст. I Международной конференции, 15 окт. 2020 г., Москва, , 2020
  • Вся высшая математика. Т.5: Теория вероятностей; Математическая статистика; Теория игр, Краснов, М. Л., 2014
  • Загорулько, Ю. А.  Искусственный интеллект. Инженерия знаний : учебное пособие для вузов / Ю. А. Загорулько, Г. Б. Загорулько. — Москва : Издательство Юрайт, 2024. — 93 с. — (Высшее образование). — ISBN 978-5-534-07198-6. — Текст : электронный // Образовательная платформа Юрайт [сайт]. — URL: https://urait.ru/bcode/540987 (дата обращения: 27.08.2024).
  • Захарова, О. И. Базы данных: методические указания к лабораторным занятиям для бакалавров по направлениям подготовки 38.03.05 – «Бизнес – информатика», 27.03.04 – «Управление в технических системах», 09.03.04 – «Программная инженерия» по дисциплине «Базы данных» : методические указания / О. И. Захарова, С. Г. Бедняк. — Самара : ПГУТИ, 2018 — Часть 2 — 2018. — 60 с. — Текст : электронный // Лань : электронно-библиотечная система. — URL: https://e.lanbook.com/book/182256 (дата обращения: 00.00.0000). — Режим доступа: для авториз. пользователей.
  • Интеллектуальные технологии управления. Искусственные нейронные сети и нечеткая логика, Усков, А. А., 2004
  • Искусственные нейронные сети : теория и практика, Круглов, В. В., 2002
  • Краткий курс математического анализа. Т.2: Дифференциальное и интегральное исчисления функций многих переменных. Гармонический анализ, Кудрявцев, Л. Д., 2008
  • Машинное обучение : наука и искусство построения алгоритмов, которые извлекают знания из данных, Флах, П., 2015
  • Случайные процессы : краткий курс : учеб. пособие для вузов, Розанов, Ю. А., 1979
  • Случайные процессы с независимыми приращениями, Скороход, А. В., 1986
  • Сорокин, А. Б. Рекомендательные системы: анамнестические и модельные методы : учебно-методическое пособие / А. Б. Сорокин, Л. М. Железняк, Р. Э. Семенов. — Москва : РТУ МИРЭА, 2022. — 65 с. — Текст : электронный // Лань : электронно-библиотечная система. — URL: https://e.lanbook.com/book/265739 (дата обращения: 00.00.0000). — Режим доступа: для авториз. пользователей.

Авторы

  • Королева Анастасия Романовна
  • Саночкин Юрий Ильич