2025/2026





Анализ данных и машинное обучение
Лучший по критерию «Полезность курса для расширения кругозора и разностороннего развития»
Статус:
Маго-лего
Кто читает:
Департамент информатики
Где читается:
Школа информатики, физики и технологий
Когда читается:
1-3 модуль
Онлайн-часы:
10
Охват аудитории:
для своего кампуса
Преподаватели:
Суворова Алёна Владимировна
Язык:
русский
Кредиты:
9
Контактные часы:
80
Программа дисциплины
Аннотация
Целью освоения дисциплины является изучение основных принципов машинного обучения, эффективных алгоритмов обучения и применения обученных моделей. В результате изучения дисциплины у студента будет сформировано представление об основных задачах, решаемых с помощью моделей машинного обучения, как в области анализа пользователей информационных систем, так и при построение сервисов и приложений, основанных на данных
Цель освоения дисциплины
- изучение основных принципов машинного обучения и анализа данных
- построение моделей для анализа пользователей и решения задач автоматизации
Планируемые результаты обучения
- Выделяет подгруппы пользователей с помощью инструментов анализа данных
- Выделяет правила из данных методами машинного обучения
- Выявляет смещения (bias) в моделях
- Знает основные понятия машинного обучения
- Интерпретирует результаты предсказания
- Интерпретирует результаты статистического анализа с учетом ограничений использованных методов
- Обосновывает выбор методов и инструментария для проверки гипотез
- Применяет основные конструкции языка Python и библиотек для анализа данных
- Строит ансамблевые модели на языке Python
- Строит модели с применением методов интерпретируемого машинного обучения
- Строит предсказательные модели на языке Python
- Строит регрессионные модели, оценивает различные типы эффектов
- Строит нейросетевые модели
- Проектирует системы с использованием машинного обучения
Содержание учебной дисциплины
- Введение, основные понятия анализа данных, анализ данных в HCI
- Выводы на основе данных
- Предсказания на основе данных. Классификация и регрессия
- Сегментация данных
- Сложные модели и их применение
- Проектирование систем, использующих машинное обучение
Элементы контроля
- Дневники проектаРезультаты выполнения заданий по темам курса на индивидуальных данных итогового проекта
- ПроектПроект по анализу данных на датасете по выбору студента. Задача зависит от выбранного датасета (например, предсказание показателя, выявление факторов, сегментация)
- Экзамен 2Письменный экзамен с теоретическими и практическими вопросами по материалам курса
- Экзамен 1
- ЭссеСтруктурированное эссе по одной из статей, связанных с методологией или применением A/B тестирования. Процесс поиска и / или анализа статьи обязательно включает использование одного из инструментов ИИ, а эссе -- рефлексию этого процесса
- Домашнее заданиеПроектирование информационной системы с моделями машинного обучения
- УпражненияДля закрепления навыков по работе с инструментарием студентам предлагается выполнить упражнения по работе на языке Python. Источник упражнений определяется преподавателем (по умолчанию -- задания из скриптов лабораторных работ), но может быть изменен студентом по согласованию с преподавателем (например, если студент уже имеет опыт работы с инструментарием).
- Онлайн-курсДля закрепления навыков по работе с задачами по статистике студентам предлагается выполнить упражнения из онлайн-курса. Источник упражнений определяется преподавателем (по умолчанию -- курс "Основы статистики"), но может быть изменен студентом по согласованию с преподавателем (например, если содержание предложенного курса уже пройдено студентом).
Промежуточная аттестация
- 2025/2026 1st module0.2 * Онлайн-курс + 0.3 * Упражнения + 0.25 * Экзамен 1 + 0.25 * Эссе
- 2025/2026 3rd module0.35 * Дневники проекта + 0.15 * Домашнее задание + 0.2 * Проект + 0.15 * Упражнения + 0.15 * Экзамен 2
Список литературы
Рекомендуемая основная литература
- Keith McNulty. (2021). Handbook of Regression Modeling in People Analytics : With Examples in R and Python. Chapman and Hall/CRC.
- Trevor Hastie, Robert Tibshirani , et al., The Elements of Statistical Learning: Data Mining, Inference, and Prediction, 2nd edition, 2017. Free from the publisher: https://web.stanford.edu/~hastie/ElemStatLearn/printings/ESLII_print12.pdf
- Вьюгин, В. В. Математические основы машинного обучения и прогнозирования : учебное пособие / В. В. Вьюгин. — Москва : МЦНМО, 2014. — 304 с. — ISBN 978-5-4439-2014-6. — Текст : электронный // Лань : электронно-библиотечная система. — URL: https://e.lanbook.com/book/56397 (дата обращения: 00.00.0000). — Режим доступа: для авториз. пользователей.
- Генеративное глубокое обучение. Творческий потенциал нейронных сетей - 978-5-4461-1566-2 - Дэвид Фостер - 2021 - Санкт-Петербург: Питер - https://ibooks.ru/bookshelf/371724 - 371724 - iBOOKS
- Глубокое обучение - 978-5-496-02536-2 - Николенко С., Кадурин А., Архангельская Е. - 2019 - Санкт-Петербург: Питер - https://ibooks.ru/bookshelf/356955 - 356955 - iBOOKS
- Ростовцев, В. С. Искусственные нейронные сети / В. С. Ростовцев. — 3-е изд., стер. — Санкт-Петербург : Лань, 2023. — 216 с. — ISBN 978-5-507-46446-3. — Текст : электронный // Лань : электронно-библиотечная система. — URL: https://e.lanbook.com/book/310184 (дата обращения: 00.00.0000). — Режим доступа: для авториз. пользователей.
Рекомендуемая дополнительная литература
- Ahmed, S. E. (2017). Big and Complex Data Analysis : Methodologies and Applications. Cham, Switzerland: Springer. Retrieved from http://search.ebscohost.com/login.aspx?direct=true&site=eds-live&db=edsebk&AN=1383914
- Evaluation of Regression Models: Model Assessment, Model Selection and Generalization Error. (2019). Retrieved from http://search.ebscohost.com/login.aspx?direct=true&site=eds-live&db=edsbas&AN=edsbas.C9B29B32
- Molnar, C. (2018). iml: An R package for Interpretable Machine Learning. https://doi.org/10.5281/zenodo.1299058
- Provost, F., & Fawcett, T. (2013). Data Science for Business : What You Need to Know About Data Mining and Data-Analytic Thinking (Vol. 1st ed). Beijing: O’Reilly Media. Retrieved from http://search.ebscohost.com/login.aspx?direct=true&site=eds-live&db=edsebk&AN=619895
- Глубокое обучение на Python. 2-е межд. издание. - 978-5-4461-1909-7 - Шолле Франсуа - 2023 - Санкт-Петербург: Питер - https://ibooks.ru/bookshelf/386793 - 386793 - iBOOKS