• A
  • A
  • A
  • АБB
  • АБB
  • АБB
  • А
  • А
  • А
  • А
  • А
Обычная версия сайта
Бакалавриат 2025/2026

Прикладные методы анализа данных при создании информационно-аналитических систем

Статус: Курс обязательный (Информатика и вычислительная техника)
Когда читается: 4-й курс, 1-3 модуль
Охват аудитории: для своего кампуса
Язык: русский
Контактные часы: 76

Программа дисциплины

Аннотация

Основная цель курса - формирование у слушателей системного взгляда на возможности и ограничения математического аппарата - машинного обучения и статистических методов, изучение опыта использования алгоритмов анализа данных для разработки и реализации информационно-аналитических систем (ИАС) в различных экономических сферах. Курс включает в себя изучение постановки и решения задач методами анализа данных (деревья решений, логистическая регрессии, нейронные сети), подготовке данных к использованию математическими моделями, изучение особенностей и этапов применения данных, методов анализа данных при создании ИАС, в том числе на языке программирования Python.
Цель освоения дисциплины

Цель освоения дисциплины

  • Развитие и закрепление практических навыков в построении математического обеспечения информационно-аналитических систем, включающих интеллектуальную обработку данных
  • Приобретение студентами знаний о применении различных статистических, математических методов анализа данных
  • Приобретение студентами навыка разработки и построения математического обеспечения корпоративных обучаемых экспертных систем, используемых для поддержки принятия решений
Планируемые результаты обучения

Планируемые результаты обучения

  • Объясняет общие принципы построения и цели создания информационно-аналитических систем для решения прикладных задач.
  • Различает и выявляет типы данных, пропуски, аномалии и выбросы в рамках описательного анализа
  • Преобразовывает переменные, обрабатывает пропуски и выбросы, используя общие возможности Python для предобработки данных
  • Рассчитывает и решает задачи балансировки классов и оптимизации гиперпараметров классических моделей ML
  • Сравнивает метрики качества для оценки эффективности моделей линейной и логистической регрессии, деревьев решений
  • Различает и распознаёт типы задач, для решения которых применяются бэггинг, бустинг, методы кластеризации и KNN.
  • Объясняет принципы работы ансамблевых методов (бэггинг, бустинг), методов снижения размерности и кластеризации
  • Рассчитывает расстояния для метода ближайших соседей и преобразовывает данные для снижения размерности
  • Аргументирует выбор конкретного алгоритма машинного обучения и его конфигурации для решения поставленной бизнес-задачи
  • Разрабатывает скрипты с использованием MLflow для трекинга экспериментов
  • Объясняет базовые принципы работы и архитектуры нейронных сетей (сверточных) и основ причинного вывода (uplift-моделирование)
  • Прогнозирует потенциальный эффект (uplift) от маркетинговых вмешательств, используя методы причинного вывода
  • Сравнивает подходы к построению рекомендательных систем (коллаборативная фильтрация, контентно-ориентированные) и взвешивает их альтернативы
  • Доказывает результативность своего решения в ходе презентации итоговой исследовательской работы, обосновывая выбор методов и интерпретируя полученные результаты
Содержание учебной дисциплины

Содержание учебной дисциплины

  • Основы построения ИАС, подготовка данных и классические модели ML
  • Построение классических моделей машинного обучения
  • Некоторые продвинутые подходы к решению специализирваонных задач анализа данных
Элементы контроля

Элементы контроля

  • неблокирующий Активность
  • неблокирующий Индивидуальная письменная исследовательская работа и доклад по ее результатам с презентацией
  • неблокирующий Экзамен
Промежуточная аттестация

Промежуточная аттестация

  • 2025/2026 2nd module
    0.5 * Активность + 0.5 * Активность
  • 2025/2026 3rd module
    0.1 * Активность + 0.4 * Индивидуальная письменная исследовательская работа и доклад по ее результатам с презентацией + 0.5 * Экзамен
Список литературы

Список литературы

Рекомендуемая основная литература

  • Data Science : наука о данных с нуля, Грас, Дж., 2018
  • Data science for business : what you need to know about data mining and data-analytic thinking, Provost, F., 2013
  • Python и анализ данных : первичная обработка данных с применением pandas, NumPy и Jupiter, Маккинни, У., 2023

Рекомендуемая дополнительная литература

  • Gries, P., Campbell, J., & Montojo, J. (2017). Practical Programming : An Introduction to Computer Science Using Python 3.6 (Vol. Third edition). [Place of publication not identified]: Pragmatic Bookshelf. Retrieved from http://search.ebscohost.com/login.aspx?direct=true&site=eds-live&db=edsebk&AN=1716748

Авторы

  • Романова Ирина Ивановна
  • Новиков Роман Сергеевич