2025/2026





Машинное обучение и анализ больших данных
Статус:
Маго-лего
Кто читает:
Департамент бизнес-информатики
Где читается:
Высшая школа бизнеса
Когда читается:
2 модуль
Онлайн-часы:
20
Охват аудитории:
для своего кампуса
Язык:
русский
Кредиты:
3
Контактные часы:
24
Программа дисциплины
Аннотация
Настоящая дисциплина относится к вариативной части дисциплин программы "Управление цифровым продуктом" и направлен на формирование комплексного понимания современных технологий искусственного интеллекта и их практического применения в бизнесе.В рамках курса студенты познакомятся с ключевыми концепциями машинного обучения и глубокого обучения, освоят принципы работы с данными в ИИ-проектах, изучат классические и современные методы машинного обучения. Особое внимание уделяется практическим аспектам применения технологий искусственного интеллекта в бизнес-контексте.Курс сочетает теоретическую подготовку с практическим освоением инструментов и методов управления AI-проектами. Студенты научатся оценивать эффективность ИИ-решений и принимать обоснованные решения при внедрении технологий искусственного интеллекта в бизнес-среде.
Цель освоения дисциплины
- Целью освоения дисциплины "Машинное обучение и анализ больших данных" является обучение студентов базовым навыкам использования машинного обучения и анализа данных и пониманию принципов реализации проектов, использующих технологии машинного обучения и ИИ при создании и развитии цифровых продуктов.
Планируемые результаты обучения
- Объясняет основы математики для анализа данных
- Формулирует основные постановки задач и типы данных в машинном обучении
- Применяет методы и модели решающих деревьев, простых нейронных сетей, xgboost, метода опорных векторов и демонстрирует навык их обучения
- Описывает основные концепции и методы машинного обучения, применяемые при решении классификационных и регрессионных задач
- Применяет методы кластеризации данных, сингулярного разложения, фактор-анализа, главных компонент
- Объясняет основные подходы к построению моделей обучения с подкреплением
- Описывает основные концепции нейронных сетей и методы их обучения в задачах анализа неструктурированных данных
- Применяет основные используемые методы обработки текстов, изображений и видео
- Оценивает применимости ИИ и ML-технологий для решения конкретных бизнес-задач.
- Формулирует требования к данным для ИИ и ML-проектов.
- Разрабатывает стратегии сбора и подготовки данных для машинного обучения.
- Выбирает оптимальные методы и алгоритмы машинного обучения под специфику задачи.
- Применяет понимание принципы работы и области применимости классических неглубоких моделей машинного обучения.
- Применяет понимание принципов работы и области применения в бизнес-задачах глубоких моделей машинного обучения при обработке не структурированных данных.
- Применяет понимание принципов и возможности применение методов векторного представления данных для бизнес-задач.
- Применяет понимание принципов обработки текстов на естественном языке с помощью моделей глубокого обучения и больших языковых моделей и области применения этих решений в бизнес-задачах
- Оценивает качество и эффективность ML-моделей.
- Оценивает качество и эффективность моделей глубокого обучения.
- Управляет жизненным циклом ИИ-проекта.
- Применяет принципы формирования команды ИИ-проекта.
Содержание учебной дисциплины
- Введение в искусственный интеллект и машинное обучение
- Управление данными в ИИ
- Классические методы машинного обучения
- Основы машинного обучения и больших данных
- Обучение с учителем
- Обучение без учителя
- Неструктурированные данные
- Введение в глубокое обучение
- Задачи обучения без учителя, эмбеддинги
- Технологии обработки текста на естественном языке и большие языковые модели и их применение в бизнесе
Элементы контроля
- ТестПромежуточное тестирование
- Групповой проект (итоговый)Промежуточное тестирование проводится на платформе Startexam
- Аудиторная работа
Промежуточная аттестация
- 2025/2026 2nd module0.1 * Аудиторная работа + 0.6 * Групповой проект (итоговый) + 0.3 * Тест
Список литературы
Рекомендуемая основная литература
- 9781838820046 - Lapan, Maxim - Deep Reinforcement Learning Hands-On : Apply Modern RL Methods to Practical Problems of Chatbots, Robotics, Discrete Optimization, Web Automation, and More, 2nd Edition - 2020 - Packt Publishing - http://search.ebscohost.com/login.aspx?direct=true&db=nlebk&AN=2366458 - nlebk - 2366458
- Aman Kedia, & Mayank Rasu. (2020). Hands-On Python Natural Language Processing : Explore Tools and Techniques to Analyze and Process Text with a View to Building Real-world NLP Applications. Packt Publishing.
- Dipanjan Sarkar. (2019). Text Analytics with Python : A Practitioner’s Guide to Natural Language Processing: Vol. Second edition. Apress.
- GPT-3 : the ultimate guide to building NLP products with OpenAI API, Kublik, S., 2022
- Yang, X.-S. (2019). Introduction to Algorithms for Data Mining and Machine Learning. Academic Press.
- Аналитическая культура : от сбора данных до бизнес-результатов, Андерсон, К., 2023
- Введение в машинное обучение с помощью Python : руководство для специалистов по работе с данными, Мюллер, А., 2018
- Глубокое обучение на Python, Шолле, Ф., 2023
- Глубокое обучение, Вейдман, С., 2021
- Глубокое обучение, Гудфеллоу, Я., 2018
- Глубокое обучение. Самый краткий и понятный курс, Келлехер, Д. Д., 2022
- Информационные технологии анализа данных. Data Analysis : учебное пособие, Петрунин, Ю. Ю., 2023
- Корпоративное озеро больших данных : новый подход к использованию Big Data и Data Science в бизнесе, Горелик, А., 2023
- Маккинни, У. Python и анализ данных / У. Маккинни , перевод с английского А. А. Слинкина. — 2-ое изд., испр. и доп. — Москва : ДМК Пресс, 2020. — 540 с. — ISBN 978-5-97060-590-5. — Текст : электронный // Лань : электронно-библиотечная система. — URL: https://e.lanbook.com/book/131721 (дата обращения: 00.00.0000). — Режим доступа: для авториз. пользователей.
- Машинное обучение с помощью Python : руководство для специалистов по работе с данными, Мюллер, А., 2022
- Машинное обучение: алгоритмы для бизнеса, Прадо де, М. Л., 2019
- Методы разноуровневого анализа текстов на естественном языке и их приложения в системах информаци... : автореф. дис. ... д-ра техн. наук : 1.2.1, Смирнов, И. В., 2024
- Наука о данных : базовый курс, Келлехер, Д. Д., 2023
- Рашка, С. Python и машинное обучение: крайне необходимое пособие по новейшей предсказательной аналитике, обязательное для более глубокого понимания методологии машинного обучения : руководство / С. Рашка , перевод с английского А. В. Логунова. — Москва : ДМК Пресс, 2017. — 418 с. — ISBN 978-5-97060-409-0. — Текст : электронный // Лань : электронно-библиотечная система. — URL: https://e.lanbook.com/book/100905 (дата обращения: 00.00.0000). — Режим доступа: для авториз. пользователей.
Рекомендуемая дополнительная литература
- 9781789958294 - Raschka, Sebastian; Mirjalili, Vahid - Python Machine Learning : Machine Learning and Deep Learning with Python, Scikit-learn, and TensorFlow 2, 3rd Edition - 2019 - Packt Publishing - http://search.ebscohost.com/login.aspx?direct=true&db=nlebk&AN=2329991 - nlebk - 2329991
- Aurélien Géron. (2019). Hands-On Machine Learning with Scikit-Learn, Keras, and TensorFlow : Concepts, Tools, and Techniques to Build Intelligent Systems: Vol. Second edition. O’Reilly Media.
- Nandy, A., & Biswas, M. (2018). Reinforcement Learning : With Open AI, TensorFlow and Keras Using Python. [Berkeley, CA]: Apress. Retrieved from http://search.ebscohost.com/login.aspx?direct=true&site=eds-live&db=edsebk&AN=1651811
- Python для сложных задач: наука о данных и машинное обучение - 978-5-496-03068-7 - Плас Дж. Вандер - 2018 - Санкт-Петербург: Питер - https://ibooks.ru/bookshelf/356721 - 356721 - iBOOKS
- Wei-Meng Lee. 2019. Python Machine Learning. John Wiley & Sons, Incorporated
- Шарден, Б. Крупномасштабное машинное обучение вместе с Python : учебное пособие / Б. Шарден, Л. Массарон, А. Боскетти , перевод с английского А. В. Логунова. — Москва : ДМК Пресс, 2018. — 358 с. — ISBN 978-5-97060-506-6. — Текст : электронный // Лань : электронно-библиотечная система. — URL: https://e.lanbook.com/book/105836 (дата обращения: 00.00.0000). — Режим доступа: для авториз. пользователей.