• A
  • A
  • A
  • АБB
  • АБB
  • АБB
  • А
  • А
  • А
  • А
  • А
Обычная версия сайта
Магистратура 2025/2026

Прикладная наука о данных

Когда читается: 1-й курс, 1 модуль
Охват аудитории: для своего кампуса
Преподаватели: Попов Виктор Юрьевич
Язык: русский
Контактные часы: 24

Программа дисциплины

Аннотация

Дисциплина «Прикладная наука о данных» знакомит магистрантов с полным жизненным циклом data-driven проекта, ориентированного на решение конкретных бизнес-задач. Курс сфокусирован не на глубоком изучении алгоритмов, а на их практическом применении, интерпретации результатов в терминах бизнес-метрик (LTV, Churn Rate, ROI) и управлении проектами. Особое внимание уделяется коммуникации между бизнес-заказчиком и data-командой, визуализации данных и внедрению прототипов решений.
Цель освоения дисциплины

Цель освоения дисциплины

  • Сформировать системное понимание роли данных в современном бизнесе. Студент сможет объяснить, как данные создают конкурентные преимущества, повышают операционную эффективность и позволяют принимать более обоснованные управленческие решения. Это включает понимание разницы между описательной, диагностической, прогнозной и предписывающей аналитикой.
  • Обучить технологии сквозного цикла работы над data-проектом. Выпускник будет способен управлять всеми этапами жизненного цикла данных — от формулировки гипотезы и сбора данных до развертывания прототипа модели и измерения её бизнес-эффекта. Акцент делается на практическом применении инструментов (Python, библиотеки анализа, BI-системы) для решения конкретных задач.
  • Развить навыки преобразования бизнес-проблем в задачи Data Science и интерпретации результатов. Студент научится корректно переводить расплывчатые бизнес-вопросы («хотим снизить отток», «нужно увеличить средний чек») в формализованные постановки задач машинного обучения (бинарная классификация, регрессия). Ключевой навык — объяснение результатов работы модели (например, feature importance) в терминах бизнес-логики и измеримых метрик (LTV, Churn Rate, ROI).
  • Привить компетенции по оценке экономической эффективности и управлению data-проектами. Умение проводить стоимостно-экономический анализ (Cost-Benefit Analysis), рассчитывать ожидаемую доходность инвестиций (ROI) в data-проект и обосновывать его целесообразность для бизнес-заказчика. Это включает основы управления командой, таймлайнми и ресурсами в рамках agile-подхода.
  • Выработать навыки эффективной коммуникации между бизнес- и техническими командами. Студент освоит принципы визуализации данных и подготовки презентаций для не-technical аудитории (топ-менеджмент, заказчики). Особое внимание уделяется этическим аспектам работы с данными (предвзятость алгоритмов, конфиденциальность) и управлению ожиданиями стейкхолдеров.
Планируемые результаты обучения

Планируемые результаты обучения

  • · Знать: Основные понятия data-driven подхода (данные, метрики, инсайты), этапы жизненного цикла данных по методологии CRISP-DM. · Уметь: Отличать data-driven решения от интуитивных, формулировать бизнес-гипотезы, пригодные для проверки данными. · Владеть: Навыком первичного анализа бизнес-кейса и определения ключевых метрик успеха (KPI) проекта.
  • Умение отличать data-driven решения от интуитивных, формулировать гипотезы
  • Навыки командной работы, распределения задач, работы с Git.
  • Умение анализировать распределения, находить аномалии, выдвигать гипотезы.
  • Владение методами предобработки данных, создание бизнес-признаков.
  • Умение выбирать метрики, строить и оценивать модели.
  • Планируемые результаты: Умение обучать ансамбли, анализировать важность признаков.
  • Планируемые результаты: Умение строить и анализировать временные ряды.
  • Умение упаковывать модели в контейнеры, создавать API
  • Умение выявлять ethical issues, адаптировать язык для аудитории.
Содержание учебной дисциплины

Содержание учебной дисциплины

  • Введение в дисциплину
  • Data-Driven Company. От бизнес-проблемы к data-решению
  • Формирование команд. Выбор и формулировка кейса
  • Диагностическая аналитика и EDA. Визуализация для принятия решений
  • Предобработка данных и feature engineering для бизнес-задач
  • Основы машинного обучения для бизнеса. Классификация и регрессия
  • Ансамбли моделей и их интерпретация
  • Временные ряды в бизнесе
  • Операционализация ML-моделей (MLOps)
  • Коммуникация и этика в Data Science
Элементы контроля

Элементы контроля

  • неблокирующий Защита проекта по тематике дисциплины на предложенную и согласованную тему
  • неблокирующий Письменный экзамен
  • неблокирующий Посещение аудиторных и/или онлайн лекций и семинаров
  • неблокирующий Активность на лекциях и семинарах, самостоятельная работа.
Промежуточная аттестация

Промежуточная аттестация

  • 2025/2026 1st module
    0.1 * Активность на лекциях и семинарах, самостоятельная работа. + 0.2 * Защита проекта по тематике дисциплины на предложенную и согласованную тему + 0.6 * Письменный экзамен + 0.1 * Посещение аудиторных и/или онлайн лекций и семинаров
Список литературы

Список литературы

Рекомендуемая основная литература

  • 18590 - Методы принятия решений: Серия “Harvard Business Review: 10 лучших статей” (краткое изложение) - к. авторов - getAbstract - 9785961400134ga - 2018 - https://hse.alpinadigital.ru/book/18590 - Alpina
  • 36460 - Вероятностное машинное обучение. Дополнительные темы: основания, вывод - К.Мэрфи - ДМК Пресс - 9785937001207 - 2024 - https://hse.alpinadigital.ru/document/36460 - Alpina
  • 36492 - Вероятностное машинное обучение. Дополнительные темы: предсказание, порождение, обнаружение, действие - К.Мэрфи - ДМК Пресс - 9785937003171 - 2024 - https://hse.alpinadigital.ru/document/36492 - Alpina
  • 9780262046824 - Kevin P. Murphy - Probabilistic Machine Learning - 2022 - MIT Press - https://search.ebscohost.com/login.aspx?direct=true&db=nlebk&AN=2932689 - nlebk - 2932689
  • 9781800206571 - Serg Masís - Interpretable Machine Learning with Python : Learn to Build Interpretable High-performance Models with Hands-on Real-world Examples - 2021 - Packt Publishing - https://search.ebscohost.com/login.aspx?direct=true&db=nlebk&AN=2901980 - nlebk - 2901980
  • Adam Aspin. (2020). Pro Power BI Desktop : Self-Service Analytics and Data Visualization for the Power User: Vol. Third edition. Apress.
  • Aurélien Géron. (2019). Hands-On Machine Learning with Scikit-Learn, Keras, and TensorFlow : Concepts, Tools, and Techniques to Build Intelligent Systems: Vol. Second edition. O’Reilly Media.
  • Bernard Marr, & Matt Ward. (2019). Artificial Intelligence in Practice : How 50 Successful Companies Used AI and Machine Learning to Solve Problems. Wiley.
  • Choudhury, P., Allen, R. T., & Endres, M. G. (2021). Machine learning for pattern discovery in management research. Strategic Management Journal (John Wiley & Sons, Inc.), 42(1), 30–57. https://doi.org/10.1002/smj.3215
  • Data science for business : what you need to know about data mining and data-analytic thinking, Provost, F., 2013
  • Data Science. Наука о данных с нуля: Пер. с англ. — 2-е изд., перераб. и доп. - 978-5-9775-6731-2 - Грас Д. - 2021 - Санкт-Петербург: БХВ-Петербург - https://ibooks.ru/bookshelf/356414 - 356414 - iBOOKS
  • Döbler, M., & Grössmann, T. (2019). Data Visualization with Python : Create an Impact with Meaningful Data Insights Using Interactive and Engaging Visuals. Packt Publishing.
  • Harvard Business Review Press. (2019). Artificial Intelligence : The Insights You Need From Harvard Business Review. La Vergne: Harvard Business Review Press. Retrieved from http://search.ebscohost.com/login.aspx?direct=true&site=eds-live&db=edsebk&AN=2003692
  • James Douglas Hamilton. (2020). Time Series Analysis. Princeton University Press.
  • James, G. et al. An introduction to statistical learning. – Springer, 2013. – 426 pp.
  • Kirk, A. (2016). Data Visualization: Representing Information on Modern Web. [U.K.?]: Packt Publishing. Retrieved from http://search.ebscohost.com/login.aspx?direct=true&site=eds-live&db=edsebk&AN=1364679
  • McKinney, W. (2018). Python for Data Analysis : Data Wrangling with Pandas, NumPy, and IPython (Vol. Second edition). Sebastopol, CA: O’Reilly Media. Retrieved from http://search.ebscohost.com/login.aspx?direct=true&site=eds-live&db=edsebk&AN=1605925
  • Methods for Data science. Vol.3: Data visualization and R, Godfrey, J., 2015
  • Noah Gift, & Alfredo Deza. (2021). Practical MLOps: Vol. First edition. O’Reilly Media.
  • Provost, F., & Fawcett, T. (2013). Data Science for Business : What You Need to Know About Data Mining and Data-Analytic Thinking (Vol. 1st ed). Beijing: O’Reilly Media. Retrieved from http://search.ebscohost.com/login.aspx?direct=true&site=eds-live&db=edsebk&AN=619895
  • Provost, Foster, Fawcett, Tom. Data Science for Business: What you need to know about data mining and data-analytic thinking. – " O'Reilly Media, Inc.", 2013.
  • Python для data science. - 978-5-4461-2392-6 - Васильев Юлий - 2023 - Санкт-Петербург: Питер - https://ibooks.ru/bookshelf/390133 - 390133 - iBOOKS
  • Python для сложных задач : наука о данных и машинное обучение, Плас, Дж. В., 2018
  • Python для сложных задач: наука о данных и машинное обучение : пер. с англ., Плас, Дж. Вандер, 2019
  • Python для сложных задач: наука о данных и машинное обучение. - 978-5-4461-0914-2 - Плас Дж. Вандер - 2021 - Санкт-Петербург: Питер - https://ibooks.ru/bookshelf/376830 - 376830 - iBOOKS
  • Richert, W., & Coelho, L. P. (2013). Building Machine Learning Systems with Python. Birmingham: Packt Publishing. Retrieved from http://search.ebscohost.com/login.aspx?direct=true&site=eds-live&db=edsebk&AN=619996
  • Wei-Meng Lee. 2019. Python Machine Learning. John Wiley & Sons, Incorporated
  • Wei-Meng Lee. 2019. Python Machine Learning. John Wiley & Sons, Incorporated
  • Wei, W. W. S. (2019). Multivariate Time Series Analysis and Applications. Hoboken, NJ: Wiley. Retrieved from http://search.ebscohost.com/login.aspx?direct=true&site=eds-live&db=edsebk&AN=1995235
  • Анализ данных в науке и технике : машинное обучение, динамические системы и управление, Брантон, С. Л., 2021
  • Введение в машинное обучение с помощью Python : руководство для специалистов по работе с данными, Мюллер, А., 2018
  • Воейко, О. А. Анализ временных рядов и прогнозирование: практикум : учебное пособие / О. А. Воейко. — Королёв : МГОТУ, 2019. — 175 с. — ISBN 978-5-4499-0178-1. — Текст : электронный // Лань : электронно-библиотечная система. — URL: https://e.lanbook.com/book/343160 (дата обращения: 00.00.0000). — Режим доступа: для авториз. пользователей.
  • Изучаем Python. Программирование игр, визуализация данных, веб-приложения. 2-е изд. - 978-5-4461-0479-6 - Мэтиз Э. - 2017 - Санкт-Петербург: Питер - https://ibooks.ru/bookshelf/355480 - 355480 - iBOOKS
  • Интерпретируемое машинное обучение на Python: Пер. с англ. - 978-5-9775-1735-5 - Масис С. - 2023 - Санкт-Петербург: БХВ-Петербург - https://ibooks.ru/bookshelf/389646 - 389646 - iBOOKS
  • Книга Kaggle. Машинное обучение и анализ данных / Пер. с англ. - 978-5-9775-1903-8 - Банахевич К., Массарон Л. - 2024 - Санкт-Петербург: БХВ-Петербург - https://ibooks.ru/bookshelf/396446 - 396446 - iBOOKS
  • Лебедева, Т. В. Анализ временных рядов и бизнес-прогнозирование : учебно-методическое пособие / Т. В. Лебедева. — Оренбург : ОГУ, 2018. — 240 с. — ISBN 978-5-7410-2205-4. — Текст : электронный // Лань : электронно-библиотечная система. — URL: https://e.lanbook.com/book/159738 (дата обращения: 00.00.0000). — Режим доступа: для авториз. пользователей.
  • Машинное обучение. Портфолио реальных проектов. . - 978-5-4461-1978-3 - Григорьев Алексей - 2023 - Санкт-Петербург: Питер - https://ibooks.ru/bookshelf/390208 - 390208 - iBOOKS
  • Платонов, А. В.  Машинное обучение : учебное пособие для вузов / А. В. Платонов. — 2-е изд. — Москва : Издательство Юрайт, 2025. — 89 с. — (Высшее образование). — ISBN 978-5-534-20732-3. — Текст : электронный // Образовательная платформа Юрайт [сайт]. — URL: https://urait.ru/bcode/558662 (дата обращения: 04.07.2025).
  • Подкорытова, О. А.  Анализ временных рядов : учебное пособие для вузов / О. А. Подкорытова, М. В. Соколов. — 2-е изд., перераб. и доп. — Москва : Издательство Юрайт, 2025. — 225 с. — (Высшее образование). — ISBN 978-5-534-19441-8. — Текст : электронный // Образовательная платформа Юрайт [сайт]. — URL: https://urait.ru/bcode/556470 (дата обращения: 04.07.2025).
  • Попова, И. Н.  Анализ временных рядов : учебник для вузов / И. Н. Попова ; ответственный редактор В. В. Ковалев. — Москва : Издательство Юрайт, 2025. — 74 с. — (Высшее образование). — ISBN 978-5-534-18394-8. — Текст : электронный // Образовательная платформа Юрайт [сайт]. — URL: https://urait.ru/bcode/568821 (дата обращения: 04.07.2025).
  • Протодьяконов, А. В. Алгоритмы Data Science и их практическая реализация на Python : учебное пособие / А. В. Протодьяконов, П. А. Пылов, В. Е. Садовников. - Москва ; Вологда : Инфра-Инженерия, 2022. - 392 с. - ISBN 978-5-9729-1006-9. - Текст : электронный. - URL: https://znanium.com/catalog/product/1902689
  • Роман с Data Science. Как монетизировать большие данные. - 978-5-4461-1879-3 - Зыков Роман - 2021 - Санкт-Петербург: Питер - https://ibooks.ru/bookshelf/377033 - 377033 - iBOOKS
  • Сысоева, Е. А., Анализ временных рядов и прогнозирование : учебное пособие / Е. А. Сысоева, Н. В. Аникина, А. В. Катынь. — Москва : КноРус, 2025. — 180 с. — ISBN 978-5-406-13763-5. — URL: https://book.ru/book/956840 (дата обращения: 04.07.2025). — Текст : электронный.
  • Хуттер, Ф. Введение в автоматизированное машинное обучение (AutoML) : справочник / Ф. Хуттер, Л. Коттхофф, Х. Ваншорен , перевод с английского В. С. Яценкова.. — Москва : ДМК Пресс, 2023. — 256 с. — ISBN 978-5-93700-196-2. — Текст : электронный // Лань : электронно-библиотечная система. — URL: https://e.lanbook.com/book/348104 (дата обращения: 00.00.0000). — Режим доступа: для авториз. пользователей.
  • Ярушкина, Н. Г. Интеллектуальный анализ временных рядов : учебное пособие / Н. Г. Ярушкина, Т. В. Афанасьева, И. Г. Перфильева. — Москва : ФОРУМ : ИНФРА-М, 2022. — 160 с. — (Высшее образование). - ISBN 978-5-8199-0496-1. - Текст : электронный. - URL: https://znanium.com/catalog/product/1842559

Рекомендуемая дополнительная литература

  • Крупномасштабное машинное обучение вместе с Python : учитесь быстро создавать мощные модели машинного обучения и развертывать крупномасштабные приложения прогнозирования, Шарден, Б., 2018

Авторы

  • Попов Виктор Юрьевич
  • Редькина Галина Сергеевна