• A
  • A
  • A
  • АБB
  • АБB
  • АБB
  • А
  • А
  • А
  • А
  • А
Обычная версия сайта
Магистратура 2025/2026

A/B-тестирование: углубленный курс

Статус: Курс обязательный (Аналитика больших данных)
Когда читается: 2-й курс, 1 модуль
Охват аудитории: для своего кампуса
Язык: русский
Контактные часы: 28

Программа дисциплины

Аннотация

Дисциплина для джуниор+/миддл-аналитиков, которые хотят систематизировать и углубить свои знания в А/В-тестировании, внедрить А/В-тесты на работе, а также научиться применять аналитические подходы Diff-in-Diff, Causal Impact и PSM, которые помогут оценить эффект от изменений в ситуациях, когда проведение классического A/B-теста невозможно.
Цель освоения дисциплины

Цель освоения дисциплины

  • Студенты научатся проводить A/B-тесты от этапа формулировки гипотез до финального анализа результатов, используя платформу A/B-тестирования, Google Sheets и Jupyter Notebook;
  • Студенты разберутся в ключевых понятиях математической статистики, включая точечные оценки, стандартное отклонение, дисперсию, нормальное распределение и принципы проверки гипотез;
  • Студенты овладеют методами расчёта размера выборки, минимально детектируемого эффекта (MDE) и научатся проектировать эксперименты с учётом продолжительности, чувствительности и корректного распределения пользователей;
  • Студенты научатся использовать доверительные интервалы, тест Стьюдента и Bootstrap-методы для оценки статистической значимости изменений и проверки гипотез в реальных данных;
  • Студенты получат практические навыки повышения чувствительности экспериментов за счёт фильтрации выбросов, стратификации, пост-стратификации и применения метода CUPED;
  • Студенты освоят подходы к работе с метриками, включая выбор целевых, контрольных и вспомогательных метрик, построение иерархий метрик и анализ метрик отношения с использованием дельта-метода и линеаризации;
  • Студенты изучат методы causal inference, включая Diff-in-Diff, Causal Impact и Propensity Score Matching, и научатся применять их в ситуациях, где невозможны классические A/B-тесты.
Планируемые результаты обучения

Планируемые результаты обучения

  • Студенты научатся объяснять, что такое A/B-тестирование и как его использовать для принятия решений на основе данных.
  • Студенты научатся интерпретировать статистические критерии, включая понятия нулевой и альтернативной гипотезы, уровня значимости и p-value.
  • Студенты научатся применять тест Стьюдента в задачах A/B-тестирования и разбираться в его формуле, допущениях и распределении.
  • Студенты научатся проверять корректность применения t-теста с помощью синтетических и исторических данных.
  • Студенты научатся выявлять ограничения теста Стьюдента и оценивать, подходит ли он для конкретного эксперимента
  • Познакомимся с учебной платформой А/B-тестирования
  • Рассмотрим несколько способов принятия решений. Узнаем, чем хорошо А/B-тестирование
  • Вспомним базовые определения из математической статистики: случайная величина, выборка, распределение случайной величины, статистика, среднее, дисперсия, стандартное отклонение, точечная оценка
  • С помощью данных ответим на вопросы о том, какие товары входят в топ3 по выручке и какова доля пользователей, возвращающихся в течение месяца
  • - Узнаем что такое гипотеза и эффект эксперимента
  • - Узнаем как проверять гипотезы с помощью A/B тестирования
  • - Узнаем что такое ошибки I и II рода, мощность и уровень значимости
  • - Познакомимся с тестом Стьюдента. Узнаем что такое p-value
  • - Узнаем, как пользоваться p-value
  • - Научимся применять тест Стьюдента и вычислим p value для одного эксперимента
  • - Узнаем что такое дизайн эксперимента
  • - Узнаем что как оценивать размер групп и минимальный ожидаемый эффект
  • - Обсудим нюансы выборки периода проведения эксперимента и подбора групп
  • - Научимся оценивать необходимый размер групп для эксперимента
  • - Узнаем как проверять корректность дизайна A/B теста
  • - Разберём что такое синтетические АА и A/B тесты
  • - Изучим и сравним разные способы добавления эффекта для оценки вероятности ошибки второго рода
  • - Научимся оценивать ошибки первого и второго рода
  • - Узнаем что такое доверительный интервал
  • - Рассмотрим три способа построения доверительного интервала
  • - Узнаем что такое бутстреп, как с его помощью проверять гипотезы, его плюсы и минусы
  • - Проверим ряд гипотез с разными метриками с помощью Bootstrap
  • - Обсудим, что такое чувствительность тестов и как она связана с дисперсией данных
  • - Узнаем, что такое выбросы, как они влияют на чувствительность эксперимента и как с ними можно работать
  • - Исследуем как влияет удаление выбросов на результаты эксперимента
  • - Вспомним, что такое конкретная гипотеза
  • - Узнаем, что такое целевая, вспомогательная и контрольная метрики
  • - Обсудим свойства метрик
  • - Обсудим, как выбирать метрики
  • - Узнаем, как можно систематизировать метрики с помощью иерархии метрик
  • Разработаем способ вычисления метрики в сложном кейсе с помощью задачи про лифт
  • - Изучим способ повышения чувствительности - стратификацию
  • - Рассмотрим стратификацию и постстратификацию
  • - Узнаем что такое обычное среднее и стратифицированное среднее
  • - Узнаем что такое случайно и стратифицированное сэмплирование
  • - Обсудим способы формирования страт для получения наибольшей чувствительности
  • - Реализуем функцию стратифицированного распределения клиентов по группам
  • - Изучим способ повышения чувствительности - CUPED
  • - Обсудим как выбирать ковиату
  • - Оценим эксперимент с применением CUPED
  • Применим методы для вычисления CUPED-метрики
  • - Обсудим как проверять несколько гипотез одновременно
  • - Узнаем что такое совместные и несовместные эксперименты
  • - Разберём поправку Бонферрони-Холма для множественного тестирования
  • - Узнаем что такое Кенери деплоймент
  • Оценим количество зависимых и независимых экспериментов, которые можно запустить параллельно
  • - Обсудим подходы к распределению пользователей по экспериментам
  • - Рассмотрим одномерную и многомерную схемы распределения пользователей
  • - Узнаем, зачем применяется метод распределения экспериментов по бакетам
  • - Применим метод распределения экспериментов по бакетам
  • - Узнаем, почему тест Стьюдента не работает с метрикой отношения
  • - Разберем дельта-метод и линеаризацию
  • - Научимся оценивать эксперименты с метрикой отношения
  • - Оценим эксперимент с использованием метода линеаризации
  • - Обсудим полный пайплайн A/B тестирования.
  • - Разберём чек-лист: что делать до, во время и после окончания эксперимента.
  • Научится проводить полный пайплайн исследования
  • В случаях, когда невозможно корректно применить рандомизированные АБ-тесты, умеет использовать методики causal inference, в частности diff-in-diff
  • Знает теорию causal inference
  • Находит альфа и бета Diff in Diff методики (Через симуляции на ретроспективных данных рассчитывает возможные альфа и бета при таких методиках)
  • По данным симуляции оценивает MDE методики Diff in Diff
  • Оценивает ожидаемое время, необходимое для теста
  • Применяет базовый алгоритм diff-in-diff
  • Умеет применять базовый алгоритм causal impact
  • Знает теорию causal impact
  • Находит альфа и бета методики Causal Impact
  • Оценивает MDE методики Causal Impact
  • Правильно подбирает ковариаты
  • Умеет применять базовый алгоритм PSM
  • Знает теорию PSM
  • Находит альфа и бета методики Propensity Score matching
  • Оценивает чувствительность методики
Содержание учебной дисциплины

Содержание учебной дисциплины

  • Вебинар "Введение в А/Б-тесты: тест Стьюдента"
  • Знакомство с платформой а/б-тестирования. Основы статистики
  • Семинар Основы статистики
  • Проверка гипотез
  • Семинар Проверка гипотез
  • Дизайн эксперимента. MDE. Sample Size
  • Семинар Sample Size
  • Тестирование дизайна
  • Семинар Тестирование дизайна
  • Доверительные интервалы
  • Семинар Доверительные интервалы
  • Повышение чувствительности тестов
  • Семинар Повышение чувствительности тестов
  • Выбор метрик
  • Семинар Выбор метрик
  • Стратификация
  • Семинар Стратификация
  • CUPED
  • Семинар CUPED
  • Множественное тестирование
  • Семинар Множественное тестирование
  • Сплитилка трафика
  • Семинар Сплитилка трафика
  • Анализ метрик отношения
  • Семинар Анализ метрик отношения
  • Полный пайплайн А/В-тестирования
  • Финальный тест
  • Методики сausal inference. Методика Diff in Diff
  • Методика Causal Impact
  • Методика Propensity Score matching (PSM)
Элементы контроля

Элементы контроля

  • блокирующий Домашнее задание к разделам (урокам) 2-30. Квиз на закрепление основных понятий урока.
    62 тестовых задания: 2 урок - 4 задания, 4 урок - 10 заданий, 6 урок - 3 задания, 8 урок - 3 задания, 10 урок - 4 задания, 12 урок - 1 задание, 14 урок - 6 заданий, 16 урок - 7 заданий, 18 урок - 2 задания, 20 урок - 3 задания, 22 урок - 4 задания, 24 урок - 3 задания, 28 урок - 3 задания, 29 урок - 4 задания, 30 урок - 5 заданий.
  • блокирующий Домашнее задание к р. (урокам) 2-30. Практические задания по вычислениям для проведения А/В-тестов.
    103 практических задач: 2 урок - 6 заданий, 3 урок - 6 заданий, 4 урок - 6 заданий, 5 урок - 3 задания, 6 урок - 3 задания, 7 урок - 3 задания, 8 урок - 3 задания, 9 урок - 5 заданий, 10 урок - 1 задание, 11 урок - 2 задания, 12 урок - 4 задания, 13 урок - 3 задания, 14 урок - 2 задания, 15 урок - 3 задания, 16 урок - 5 заданий, 17 урок - 3 задания, 18 урок - 6 заданий, 19 урок - 2 задания, 20 урок - 1 задание, 21 урок - 2 задания, 23 урок - 2 задания, 24 урок - 2 задания, 25 урок - 2 задания, 26 урок - 2 задания, 28 урок - 7 заданий, 29 урок - 10 заданий, 30 урок - 9 заданий.
  • блокирующий Финальное тестирование по А/В-тестам (27 урок).
    Студентам предоставляется финальное тестирование из 26 заданий, который проверит их знания и навыки проведения полного пайплайна тестирования.
Промежуточная аттестация

Промежуточная аттестация

  • 2025/2026 1st module
    Итоговая оценка соответствует сумме баллов за выполненные задания на LMS karpov.courses, приведенные к 10-балльной шкале (см. таблицу). Для каждого задания на LMS-платформе karpov.courses определён дедлайн в 14 календарных дней, после наступления которого студенту начисляется 70% от итогового балла за задание.
Список литературы

Список литературы

Рекомендуемая основная литература

  • Доверительное A/B-тестирование : практическое руководство по контролируемым экспериментам, Кохави, Р., 2021

Рекомендуемая дополнительная литература

  • Математическая статистика. Оценка параметров. Проверка гипотез : учеб. пособие для вузов, Боровков, А. А., 1984

Авторы

  • Ахмедова Гюнай Интигам кызы