Магистратура
2025/2026




Математика для анализа данных (математическая статистика)
Статус:
Курс по выбору (Анализ данных в девелопменте)
Где читается:
Факультет компьютерных наук
Когда читается:
1-й курс, 2 модуль
Охват аудитории:
для своего кампуса
Преподаватели:
Пиле Ян Эрнестович
Язык:
русский
Кредиты:
3
Контактные часы:
28
Программа дисциплины
Аннотация
Курс охватывает современные статистические методы, применяемые для анализа данных и экспериментов. Основной акцент сделан на практическом использовании теоретических результатов статистики для планирования, проведения и интерпретации A/B-тестов и других экспериментов. Курс сочетает напоминание базовых идей и обсуждение продвинутых техник, включая методы для коррелированных и сложных метрик, адаптивные эксперименты и байесовские подходы.
Цель освоения дисциплины
- Формирование у студентов целостного понимания современных статистических методов, применяемых для анализа данных и экспериментов, включая A/B-тесты, адаптивные эксперименты и байесовские подходы. Курс направлен на развитие навыков: • выбора корректного статистического инструментария для анализа данных, • интерпретации результатов, • выявления и предотвращения типичных ошибок в экспериментировании.
Планируемые результаты обучения
- Знать основные парадигмы статистического вывода (частотный и байесовский подходы)
- Знать параметрические и непараметрические статистические тесты (t-тест, U-тест Манна–Уитни, χ²-тест, бутстреп, тесты типа колмогорова-смирнова)
- Знать методы повышения мощности тестов (CUPED, ковариаты в регрессиях, корректировки на множественные сравнения)
- Знать алгоритмы адаптивных экспериментов (ε-greedy, UCB, Thompson Sampling, contextual bandits, правила ранней остановки тестов)
- Знать статистические ловушки (p-hacking, peeking, неправильное использование метрик)
- Уметь проектировать корректный план эксперимента, включая выбор метрик и определение длительности теста (power analysis)
- Уметь выбирать и применять подходящие статистические критерии для проверки гипотез
- Уметь использовать продвинутые методы анализа ratio-метрик (линеаризация, дельта-метод, бутстреп)
- Уметь интерпретировать результаты экспериментов в условиях неоднородности данных и коррелированных метрик
- Уметь применять байесовские методы и адаптивные алгоритмы для оптимизации экспериментального дизайна
- Владеть навыками анализа данных с использованием классических и продвинутых статистических методов
- Владеть инструментами для практической оценки корректности результатов A/B-тестов
- Владеть техниками визуализации распределений и доверительных интервалов
- Владеть исследовательским подходом: постановкой гипотез, проверкой, интерпретацией и документированием результатов
- Владение практическими навыками реализации алгоритмов на Python
- Умение анализировать результаты и корректность применения
- Формирование исследовательских навыков: постановка эксперимента, анализ, визуализация результатов
Содержание учебной дисциплины
- Основы статистических гипотез и ошибки в экспериментах
- Статистические структуры данных. Проблема работы с большими данными. Приближенные методы: Count-Min Sketch, HyperLogLog, t-digest.
- Платформы A/B-тестирования и Бутстреп. Принципы построения A/B-платформ. Бутстреп как непараметрический метод оценки статистик.
- Многорукие бандиты (Multi-Armed Bandits). Сравнение с A/B-тестами. Стратегии решения задачи о многоруком бандите.
- Регрессионные тесты и тесты на квантили. Переформулировка статистического тестирования в терминах линейных регрессий. Анализ средних и квантильные метрики.
- Метрики-отношения: Проблема коррелированности метрик в A/B-тестах. Методы анализа Ratio-метрик.
- Статистические ловушки и продвинутые темы в экспериментировании.
Элементы контроля
- Домашняя работаРегулярные индивидуальные задания, направленные на закрепление теоретического материала и практическое освоение методов. Включают как аналитические задачи (вывод формул, доказательства свойств), которые будут идти в формате бонуса, так и вычислительные эксперименты с реализацией алгоритмов в Python.
- ЭкзаменФинальное испытание по дисциплине. Студент получает билет, включающий один теоретический вопрос и одну практическую задачу. Ответ предполагает устное изложение теоретического материала, вывод основных формул и решение практической задачи.
Список литературы
Рекомендуемая основная литература
- Statistical inference, Casella, G., 2002
- Наглядная математическая статистика : учеб. пособие для вузов, Лагутин, М. Б., 2019
Рекомендуемая дополнительная литература
- Burk, S. (2006). A Better Statistical Method for A/B Testing in Marketing Campaigns. Marketing Bulletin, 17, 1.
- Testing Statistical Hypotheses, with 6 illustrations, 3rd ed., 784 p., Lehmann, E. L., Romano, J. P., 2005