• A
  • A
  • A
  • АБB
  • АБB
  • АБB
  • А
  • А
  • А
  • А
  • А
Обычная версия сайта
Магистратура 2025/2026

Математика для анализа данных (математическая статистика)

Статус: Курс по выбору (Анализ данных в девелопменте)
Когда читается: 1-й курс, 2 модуль
Охват аудитории: для своего кампуса
Преподаватели: Пиле Ян Эрнестович
Язык: русский
Кредиты: 3
Контактные часы: 28

Программа дисциплины

Аннотация

Курс охватывает современные статистические методы, применяемые для анализа данных и экспериментов. Основной акцент сделан на практическом использовании теоретических результатов статистики для планирования, проведения и интерпретации A/B-тестов и других экспериментов. Курс сочетает напоминание базовых идей и обсуждение продвинутых техник, включая методы для коррелированных и сложных метрик, адаптивные эксперименты и байесовские подходы.
Цель освоения дисциплины

Цель освоения дисциплины

  • Формирование у студентов целостного понимания современных статистических методов, применяемых для анализа данных и экспериментов, включая A/B-тесты, адаптивные эксперименты и байесовские подходы. Курс направлен на развитие навыков: • выбора корректного статистического инструментария для анализа данных, • интерпретации результатов, • выявления и предотвращения типичных ошибок в экспериментировании.
Планируемые результаты обучения

Планируемые результаты обучения

  • Знать основные парадигмы статистического вывода (частотный и байесовский подходы)
  • Знать параметрические и непараметрические статистические тесты (t-тест, U-тест Манна–Уитни, χ²-тест, бутстреп, тесты типа колмогорова-смирнова)
  • Знать методы повышения мощности тестов (CUPED, ковариаты в регрессиях, корректировки на множественные сравнения)
  • Знать алгоритмы адаптивных экспериментов (ε-greedy, UCB, Thompson Sampling, contextual bandits, правила ранней остановки тестов)
  • Знать статистические ловушки (p-hacking, peeking, неправильное использование метрик)
  • Уметь проектировать корректный план эксперимента, включая выбор метрик и определение длительности теста (power analysis)
  • Уметь выбирать и применять подходящие статистические критерии для проверки гипотез
  • Уметь использовать продвинутые методы анализа ratio-метрик (линеаризация, дельта-метод, бутстреп)
  • Уметь интерпретировать результаты экспериментов в условиях неоднородности данных и коррелированных метрик
  • Уметь применять байесовские методы и адаптивные алгоритмы для оптимизации экспериментального дизайна
  • Владеть навыками анализа данных с использованием классических и продвинутых статистических методов
  • Владеть инструментами для практической оценки корректности результатов A/B-тестов
  • Владеть техниками визуализации распределений и доверительных интервалов
  • Владеть исследовательским подходом: постановкой гипотез, проверкой, интерпретацией и документированием результатов
  • Владение практическими навыками реализации алгоритмов на Python
  • Умение анализировать результаты и корректность применения
  • Формирование исследовательских навыков: постановка эксперимента, анализ, визуализация результатов
Содержание учебной дисциплины

Содержание учебной дисциплины

  • Основы статистических гипотез и ошибки в экспериментах
  • Статистические структуры данных. Проблема работы с большими данными. Приближенные методы: Count-Min Sketch, HyperLogLog, t-digest.
  • Платформы A/B-тестирования и Бутстреп. Принципы построения A/B-платформ. Бутстреп как непараметрический метод оценки статистик.
  • Многорукие бандиты (Multi-Armed Bandits). Сравнение с A/B-тестами. Стратегии решения задачи о многоруком бандите.
  • Регрессионные тесты и тесты на квантили. Переформулировка статистического тестирования в терминах линейных регрессий. Анализ средних и квантильные метрики.
  • Метрики-отношения: Проблема коррелированности метрик в A/B-тестах. Методы анализа Ratio-метрик.
  • Статистические ловушки и продвинутые темы в экспериментировании.
Элементы контроля

Элементы контроля

  • неблокирующий Домашняя работа
    Регулярные индивидуальные задания, направленные на закрепление теоретического материала и практическое освоение методов. Включают как аналитические задачи (вывод формул, доказательства свойств), которые будут идти в формате бонуса, так и вычислительные эксперименты с реализацией алгоритмов в Python.
  • неблокирующий Экзамен
    Финальное испытание по дисциплине. Студент получает билет, включающий один теоретический вопрос и одну практическую задачу. Ответ предполагает устное изложение теоретического материала, вывод основных формул и решение практической задачи.
Промежуточная аттестация

Промежуточная аттестация

  • 2025/2026 2nd module
    0.6 * Домашняя работа + 0.4 * Экзамен
Список литературы

Список литературы

Рекомендуемая основная литература

  • Statistical inference, Casella, G., 2002
  • Наглядная математическая статистика : учеб. пособие для вузов, Лагутин, М. Б., 2019

Рекомендуемая дополнительная литература

  • Burk, S. (2006). A Better Statistical Method for A/B Testing in Marketing Campaigns. Marketing Bulletin, 17, 1.
  • Testing Statistical Hypotheses, with 6 illustrations, 3rd ed., 784 p., Lehmann, E. L., Romano, J. P., 2005

Авторы

  • Емашева Валерия Анатольевна