Бакалавриат
2025/2026





Прикладные методы анализа данных при создании информационно-аналитических систем
Статус:
Курс обязательный (Информатика и вычислительная техника)
Когда читается:
4-й курс, 1-3 модуль
Охват аудитории:
для своего кампуса
Язык:
русский
Контактные часы:
76
Программа дисциплины
Аннотация
Основная цель курса - формирование у слушателей системного взгляда на возможности и ограничения математического аппарата - машинного обучения и статистических методов, изучение опыта использования алгоритмов анализа данных для разработки и реализации информационно-аналитических систем (ИАС) в различных экономических сферах.
Курс включает в себя изучение постановки и решения задач методами анализа данных (деревья решений, логистическая регрессии, нейронные сети), подготовке данных к использованию математическими моделями, изучение особенностей и этапов применения данных, методов анализа данных при создании ИАС, в том числе на языке программирования Python.
Цель освоения дисциплины
- Развитие и закрепление практических навыков в построении математического обеспечения информационно-аналитических систем, включающих интеллектуальную обработку данных
- Приобретение студентами знаний о применении различных статистических, математических методов анализа данных
- Приобретение студентами навыка разработки и построения математического обеспечения корпоративных обучаемых экспертных систем, используемых для поддержки принятия решений
Планируемые результаты обучения
- Объясняет общие принципы построения и цели создания информационно-аналитических систем для решения прикладных задач.
- Различает и выявляет типы данных, пропуски, аномалии и выбросы в рамках описательного анализа
- Преобразовывает переменные, обрабатывает пропуски и выбросы, используя общие возможности Python для предобработки данных
- Рассчитывает и решает задачи балансировки классов и оптимизации гиперпараметров классических моделей ML
- Сравнивает метрики качества для оценки эффективности моделей линейной и логистической регрессии, деревьев решений
- Различает и распознаёт типы задач, для решения которых применяются бэггинг, бустинг, методы кластеризации и KNN.
- Объясняет принципы работы ансамблевых методов (бэггинг, бустинг), методов снижения размерности и кластеризации
- Рассчитывает расстояния для метода ближайших соседей и преобразовывает данные для снижения размерности
- Аргументирует выбор конкретного алгоритма машинного обучения и его конфигурации для решения поставленной бизнес-задачи
- Разрабатывает скрипты с использованием MLflow для трекинга экспериментов
- Объясняет базовые принципы работы и архитектуры нейронных сетей (сверточных) и основ причинного вывода (uplift-моделирование)
- Прогнозирует потенциальный эффект (uplift) от маркетинговых вмешательств, используя методы причинного вывода
- Сравнивает подходы к построению рекомендательных систем (коллаборативная фильтрация, контентно-ориентированные) и взвешивает их альтернативы
- Доказывает результативность своего решения в ходе презентации итоговой исследовательской работы, обосновывая выбор методов и интерпретируя полученные результаты
Содержание учебной дисциплины
- Основы построения ИАС, подготовка данных и классические модели ML
- Построение классических моделей машинного обучения
- Некоторые продвинутые подходы к решению специализирваонных задач анализа данных
Элементы контроля
- Активность
- Индивидуальная письменная исследовательская работа и доклад по ее результатам с презентацией
- Экзамен
Промежуточная аттестация
- 2025/2026 2nd module0.5 * Активность + 0.5 * Активность
- 2025/2026 3rd module0.1 * Активность + 0.4 * Индивидуальная письменная исследовательская работа и доклад по ее результатам с презентацией + 0.5 * Экзамен
Список литературы
Рекомендуемая основная литература
- Data Science : наука о данных с нуля, Грас, Дж., 2018
- Data science for business : what you need to know about data mining and data-analytic thinking, Provost, F., 2013
- Python и анализ данных : первичная обработка данных с применением pandas, NumPy и Jupiter, Маккинни, У., 2023
Рекомендуемая дополнительная литература
- Gries, P., Campbell, J., & Montojo, J. (2017). Practical Programming : An Introduction to Computer Science Using Python 3.6 (Vol. Third edition). [Place of publication not identified]: Pragmatic Bookshelf. Retrieved from http://search.ebscohost.com/login.aspx?direct=true&site=eds-live&db=edsebk&AN=1716748