Магистратура
2025/2026





Прикладная наука о данных
Статус:
Курс обязательный (Бизнес-аналитика и системы больших данных)
Кто читает:
Департамент бизнес-информатики
Где читается:
Высшая школа бизнеса
Когда читается:
1-й курс, 1 модуль
Охват аудитории:
для своего кампуса
Преподаватели:
Попов Виктор Юрьевич
Язык:
русский
Контактные часы:
24
Программа дисциплины
Аннотация
Дисциплина «Прикладная наука о данных» знакомит магистрантов с полным жизненным циклом data-driven проекта, ориентированного на решение конкретных бизнес-задач. Курс сфокусирован не на глубоком изучении алгоритмов, а на их практическом применении, интерпретации результатов в терминах бизнес-метрик (LTV, Churn Rate, ROI) и управлении проектами. Особое внимание уделяется коммуникации между бизнес-заказчиком и data-командой, визуализации данных и внедрению прототипов решений.
Цель освоения дисциплины
- Сформировать системное понимание роли данных в современном бизнесе. Студент сможет объяснить, как данные создают конкурентные преимущества, повышают операционную эффективность и позволяют принимать более обоснованные управленческие решения. Это включает понимание разницы между описательной, диагностической, прогнозной и предписывающей аналитикой.
- Обучить технологии сквозного цикла работы над data-проектом. Выпускник будет способен управлять всеми этапами жизненного цикла данных — от формулировки гипотезы и сбора данных до развертывания прототипа модели и измерения её бизнес-эффекта. Акцент делается на практическом применении инструментов (Python, библиотеки анализа, BI-системы) для решения конкретных задач.
- Развить навыки преобразования бизнес-проблем в задачи Data Science и интерпретации результатов. Студент научится корректно переводить расплывчатые бизнес-вопросы («хотим снизить отток», «нужно увеличить средний чек») в формализованные постановки задач машинного обучения (бинарная классификация, регрессия). Ключевой навык — объяснение результатов работы модели (например, feature importance) в терминах бизнес-логики и измеримых метрик (LTV, Churn Rate, ROI).
- Привить компетенции по оценке экономической эффективности и управлению data-проектами. Умение проводить стоимостно-экономический анализ (Cost-Benefit Analysis), рассчитывать ожидаемую доходность инвестиций (ROI) в data-проект и обосновывать его целесообразность для бизнес-заказчика. Это включает основы управления командой, таймлайнми и ресурсами в рамках agile-подхода.
- Выработать навыки эффективной коммуникации между бизнес- и техническими командами. Студент освоит принципы визуализации данных и подготовки презентаций для не-technical аудитории (топ-менеджмент, заказчики). Особое внимание уделяется этическим аспектам работы с данными (предвзятость алгоритмов, конфиденциальность) и управлению ожиданиями стейкхолдеров.
Планируемые результаты обучения
- · Знать: Основные понятия data-driven подхода (данные, метрики, инсайты), этапы жизненного цикла данных по методологии CRISP-DM. · Уметь: Отличать data-driven решения от интуитивных, формулировать бизнес-гипотезы, пригодные для проверки данными. · Владеть: Навыком первичного анализа бизнес-кейса и определения ключевых метрик успеха (KPI) проекта.
- Умение отличать data-driven решения от интуитивных, формулировать гипотезы
- Навыки командной работы, распределения задач, работы с Git.
- Умение анализировать распределения, находить аномалии, выдвигать гипотезы.
- Владение методами предобработки данных, создание бизнес-признаков.
- Умение выбирать метрики, строить и оценивать модели.
- Планируемые результаты: Умение обучать ансамбли, анализировать важность признаков.
- Планируемые результаты: Умение строить и анализировать временные ряды.
- Умение упаковывать модели в контейнеры, создавать API
- Умение выявлять ethical issues, адаптировать язык для аудитории.
Содержание учебной дисциплины
- Введение в дисциплину
- Data-Driven Company. От бизнес-проблемы к data-решению
- Формирование команд. Выбор и формулировка кейса
- Диагностическая аналитика и EDA. Визуализация для принятия решений
- Предобработка данных и feature engineering для бизнес-задач
- Основы машинного обучения для бизнеса. Классификация и регрессия
- Ансамбли моделей и их интерпретация
- Временные ряды в бизнесе
- Операционализация ML-моделей (MLOps)
- Коммуникация и этика в Data Science
Элементы контроля
- Защита проекта по тематике дисциплины на предложенную и согласованную тему
- Письменный экзамен
- Посещение аудиторных и/или онлайн лекций и семинаров
- Активность на лекциях и семинарах, самостоятельная работа.
Промежуточная аттестация
- 2025/2026 1st module0.1 * Активность на лекциях и семинарах, самостоятельная работа. + 0.2 * Защита проекта по тематике дисциплины на предложенную и согласованную тему + 0.6 * Письменный экзамен + 0.1 * Посещение аудиторных и/или онлайн лекций и семинаров
Список литературы
Рекомендуемая основная литература
- 18590 - Методы принятия решений: Серия “Harvard Business Review: 10 лучших статей” (краткое изложение) - к. авторов - getAbstract - 9785961400134ga - 2018 - https://hse.alpinadigital.ru/book/18590 - Alpina
- 36460 - Вероятностное машинное обучение. Дополнительные темы: основания, вывод - К.Мэрфи - ДМК Пресс - 9785937001207 - 2024 - https://hse.alpinadigital.ru/document/36460 - Alpina
- 36492 - Вероятностное машинное обучение. Дополнительные темы: предсказание, порождение, обнаружение, действие - К.Мэрфи - ДМК Пресс - 9785937003171 - 2024 - https://hse.alpinadigital.ru/document/36492 - Alpina
- 9780262046824 - Kevin P. Murphy - Probabilistic Machine Learning - 2022 - MIT Press - https://search.ebscohost.com/login.aspx?direct=true&db=nlebk&AN=2932689 - nlebk - 2932689
- 9781800206571 - Serg Masís - Interpretable Machine Learning with Python : Learn to Build Interpretable High-performance Models with Hands-on Real-world Examples - 2021 - Packt Publishing - https://search.ebscohost.com/login.aspx?direct=true&db=nlebk&AN=2901980 - nlebk - 2901980
- Adam Aspin. (2020). Pro Power BI Desktop : Self-Service Analytics and Data Visualization for the Power User: Vol. Third edition. Apress.
- Aurélien Géron. (2019). Hands-On Machine Learning with Scikit-Learn, Keras, and TensorFlow : Concepts, Tools, and Techniques to Build Intelligent Systems: Vol. Second edition. O’Reilly Media.
- Bernard Marr, & Matt Ward. (2019). Artificial Intelligence in Practice : How 50 Successful Companies Used AI and Machine Learning to Solve Problems. Wiley.
- Choudhury, P., Allen, R. T., & Endres, M. G. (2021). Machine learning for pattern discovery in management research. Strategic Management Journal (John Wiley & Sons, Inc.), 42(1), 30–57. https://doi.org/10.1002/smj.3215
- Data science for business : what you need to know about data mining and data-analytic thinking, Provost, F., 2013
- Data Science. Наука о данных с нуля: Пер. с англ. — 2-е изд., перераб. и доп. - 978-5-9775-6731-2 - Грас Д. - 2021 - Санкт-Петербург: БХВ-Петербург - https://ibooks.ru/bookshelf/356414 - 356414 - iBOOKS
- Döbler, M., & Grössmann, T. (2019). Data Visualization with Python : Create an Impact with Meaningful Data Insights Using Interactive and Engaging Visuals. Packt Publishing.
- Harvard Business Review Press. (2019). Artificial Intelligence : The Insights You Need From Harvard Business Review. La Vergne: Harvard Business Review Press. Retrieved from http://search.ebscohost.com/login.aspx?direct=true&site=eds-live&db=edsebk&AN=2003692
- James Douglas Hamilton. (2020). Time Series Analysis. Princeton University Press.
- James, G. et al. An introduction to statistical learning. – Springer, 2013. – 426 pp.
- Kirk, A. (2016). Data Visualization: Representing Information on Modern Web. [U.K.?]: Packt Publishing. Retrieved from http://search.ebscohost.com/login.aspx?direct=true&site=eds-live&db=edsebk&AN=1364679
- McKinney, W. (2018). Python for Data Analysis : Data Wrangling with Pandas, NumPy, and IPython (Vol. Second edition). Sebastopol, CA: O’Reilly Media. Retrieved from http://search.ebscohost.com/login.aspx?direct=true&site=eds-live&db=edsebk&AN=1605925
- Methods for Data science. Vol.3: Data visualization and R, Godfrey, J., 2015
- Noah Gift, & Alfredo Deza. (2021). Practical MLOps: Vol. First edition. O’Reilly Media.
- Provost, F., & Fawcett, T. (2013). Data Science for Business : What You Need to Know About Data Mining and Data-Analytic Thinking (Vol. 1st ed). Beijing: O’Reilly Media. Retrieved from http://search.ebscohost.com/login.aspx?direct=true&site=eds-live&db=edsebk&AN=619895
- Provost, Foster, Fawcett, Tom. Data Science for Business: What you need to know about data mining and data-analytic thinking. – " O'Reilly Media, Inc.", 2013.
- Python для data science. - 978-5-4461-2392-6 - Васильев Юлий - 2023 - Санкт-Петербург: Питер - https://ibooks.ru/bookshelf/390133 - 390133 - iBOOKS
- Python для сложных задач : наука о данных и машинное обучение, Плас, Дж. В., 2018
- Python для сложных задач: наука о данных и машинное обучение : пер. с англ., Плас, Дж. Вандер, 2019
- Python для сложных задач: наука о данных и машинное обучение. - 978-5-4461-0914-2 - Плас Дж. Вандер - 2021 - Санкт-Петербург: Питер - https://ibooks.ru/bookshelf/376830 - 376830 - iBOOKS
- Richert, W., & Coelho, L. P. (2013). Building Machine Learning Systems with Python. Birmingham: Packt Publishing. Retrieved from http://search.ebscohost.com/login.aspx?direct=true&site=eds-live&db=edsebk&AN=619996
- Wei-Meng Lee. 2019. Python Machine Learning. John Wiley & Sons, Incorporated
- Wei-Meng Lee. 2019. Python Machine Learning. John Wiley & Sons, Incorporated
- Wei, W. W. S. (2019). Multivariate Time Series Analysis and Applications. Hoboken, NJ: Wiley. Retrieved from http://search.ebscohost.com/login.aspx?direct=true&site=eds-live&db=edsebk&AN=1995235
- Анализ данных в науке и технике : машинное обучение, динамические системы и управление, Брантон, С. Л., 2021
- Введение в машинное обучение с помощью Python : руководство для специалистов по работе с данными, Мюллер, А., 2018
- Воейко, О. А. Анализ временных рядов и прогнозирование: практикум : учебное пособие / О. А. Воейко. — Королёв : МГОТУ, 2019. — 175 с. — ISBN 978-5-4499-0178-1. — Текст : электронный // Лань : электронно-библиотечная система. — URL: https://e.lanbook.com/book/343160 (дата обращения: 00.00.0000). — Режим доступа: для авториз. пользователей.
- Изучаем Python. Программирование игр, визуализация данных, веб-приложения. 2-е изд. - 978-5-4461-0479-6 - Мэтиз Э. - 2017 - Санкт-Петербург: Питер - https://ibooks.ru/bookshelf/355480 - 355480 - iBOOKS
- Интерпретируемое машинное обучение на Python: Пер. с англ. - 978-5-9775-1735-5 - Масис С. - 2023 - Санкт-Петербург: БХВ-Петербург - https://ibooks.ru/bookshelf/389646 - 389646 - iBOOKS
- Книга Kaggle. Машинное обучение и анализ данных / Пер. с англ. - 978-5-9775-1903-8 - Банахевич К., Массарон Л. - 2024 - Санкт-Петербург: БХВ-Петербург - https://ibooks.ru/bookshelf/396446 - 396446 - iBOOKS
- Лебедева, Т. В. Анализ временных рядов и бизнес-прогнозирование : учебно-методическое пособие / Т. В. Лебедева. — Оренбург : ОГУ, 2018. — 240 с. — ISBN 978-5-7410-2205-4. — Текст : электронный // Лань : электронно-библиотечная система. — URL: https://e.lanbook.com/book/159738 (дата обращения: 00.00.0000). — Режим доступа: для авториз. пользователей.
- Машинное обучение. Портфолио реальных проектов. . - 978-5-4461-1978-3 - Григорьев Алексей - 2023 - Санкт-Петербург: Питер - https://ibooks.ru/bookshelf/390208 - 390208 - iBOOKS
- Платонов, А. В. Машинное обучение : учебное пособие для вузов / А. В. Платонов. — 2-е изд. — Москва : Издательство Юрайт, 2025. — 89 с. — (Высшее образование). — ISBN 978-5-534-20732-3. — Текст : электронный // Образовательная платформа Юрайт [сайт]. — URL: https://urait.ru/bcode/558662 (дата обращения: 04.07.2025).
- Подкорытова, О. А. Анализ временных рядов : учебное пособие для вузов / О. А. Подкорытова, М. В. Соколов. — 2-е изд., перераб. и доп. — Москва : Издательство Юрайт, 2025. — 225 с. — (Высшее образование). — ISBN 978-5-534-19441-8. — Текст : электронный // Образовательная платформа Юрайт [сайт]. — URL: https://urait.ru/bcode/556470 (дата обращения: 04.07.2025).
- Попова, И. Н. Анализ временных рядов : учебник для вузов / И. Н. Попова ; ответственный редактор В. В. Ковалев. — Москва : Издательство Юрайт, 2025. — 74 с. — (Высшее образование). — ISBN 978-5-534-18394-8. — Текст : электронный // Образовательная платформа Юрайт [сайт]. — URL: https://urait.ru/bcode/568821 (дата обращения: 04.07.2025).
- Протодьяконов, А. В. Алгоритмы Data Science и их практическая реализация на Python : учебное пособие / А. В. Протодьяконов, П. А. Пылов, В. Е. Садовников. - Москва ; Вологда : Инфра-Инженерия, 2022. - 392 с. - ISBN 978-5-9729-1006-9. - Текст : электронный. - URL: https://znanium.com/catalog/product/1902689
- Роман с Data Science. Как монетизировать большие данные. - 978-5-4461-1879-3 - Зыков Роман - 2021 - Санкт-Петербург: Питер - https://ibooks.ru/bookshelf/377033 - 377033 - iBOOKS
- Сысоева, Е. А., Анализ временных рядов и прогнозирование : учебное пособие / Е. А. Сысоева, Н. В. Аникина, А. В. Катынь. — Москва : КноРус, 2025. — 180 с. — ISBN 978-5-406-13763-5. — URL: https://book.ru/book/956840 (дата обращения: 04.07.2025). — Текст : электронный.
- Хуттер, Ф. Введение в автоматизированное машинное обучение (AutoML) : справочник / Ф. Хуттер, Л. Коттхофф, Х. Ваншорен , перевод с английского В. С. Яценкова.. — Москва : ДМК Пресс, 2023. — 256 с. — ISBN 978-5-93700-196-2. — Текст : электронный // Лань : электронно-библиотечная система. — URL: https://e.lanbook.com/book/348104 (дата обращения: 00.00.0000). — Режим доступа: для авториз. пользователей.
- Ярушкина, Н. Г. Интеллектуальный анализ временных рядов : учебное пособие / Н. Г. Ярушкина, Т. В. Афанасьева, И. Г. Перфильева. — Москва : ФОРУМ : ИНФРА-М, 2022. — 160 с. — (Высшее образование). - ISBN 978-5-8199-0496-1. - Текст : электронный. - URL: https://znanium.com/catalog/product/1842559
Рекомендуемая дополнительная литература
- Крупномасштабное машинное обучение вместе с Python : учитесь быстро создавать мощные модели машинного обучения и развертывать крупномасштабные приложения прогнозирования, Шарден, Б., 2018