• A
  • A
  • A
  • АБB
  • АБB
  • АБB
  • А
  • А
  • А
  • А
  • А
Обычная версия сайта
2025/2026

Научно-исследовательский семинар "Непараметрика и другие сюжеты статистики"

Статус: Дисциплина общефакультетского пула
Когда читается: 3, 4 модуль
Охват аудитории: для всех кампусов НИУ ВШЭ
Язык: русский
Кредиты: 6
Контактные часы: 72

Программа дисциплины

Аннотация

В практических задачах часто происходят ситуации, когда распределения и зависимости в данных неизвестны, или же данные содержат мало наблюдений и много шума. В таком случае на помощь приходят непараметрические методыстатистики, базовое представление о которых будет дано в этом курсе. В рамкахкурса мы надеемся рассказать об основных непараметрических критериях проверкигипотез, а также обзорно затронуть темы, которые будут полезны при анализе медицинских, социологических и других типов данных(в том числе немного затронемизучение образования, так что надеемся увидеть в том числе и студентов с программсовместных с ЦПМ)Дополнительно, планируются лекции от приглашённых специалистов, применяющих такие статистические методы на практике (социологи, медицинские статистики,аналитики, специалисты по психометрии). О каждой из лекций будет сообщено заранее.
Цель освоения дисциплины

Цель освоения дисциплины

  • -
Планируемые результаты обучения

Планируемые результаты обучения

  • --
Содержание учебной дисциплины

Содержание учебной дисциплины

  • Задача о дихотомических данных: биномиальный критерий.
  • Одновыборочная задача о положении: анализ повторных наблюдений с помощью знаковых рангов, анализ повторных парных наблюдений с помощью знаков (свободный от распределения критерий знаков Фишера), анализ данных одной выборки.
  • Двухвыборочная задача о положении (сдвиге): свободный от распределения критерий знаковых ранговых сумм Уилкоксона, оценка Ходжес – Лемана.
  • Двухвыборочная задача о рассеянии (масштабе): свободный от распределения ранговый критерий Ансари – Брэдли, свободный от распределения критерий Мизеса.
  • Критерии согласия: 𝜒2, Колмогорова – Смирнова и др.
  • Однофакторный дисперсионный анализ: свободные от распределения критериии Краскела – Уоллиса, Джонкхиера – Терпстры
  • Двухфакторный дисперсионный анализ: свободные от распределения критерии Фридмана, Кендала и Бэбингтона Смита, свободные от распределения критерии для альтернатив с упорядочива- нием Пейджа.
  • Корелляции Пирсона, Спирмена, Кендэла. Свободный от распределения критерий независимости Кендэла.
  • Коэффициенты согласованности: альфа-кронбаха, омега-макдональда, коэффициент конкордации. Применение этих коэффициентов к анализу психометрических данных.
  • Сравнение двух вероятностей успеха (таблицы сопряжённости). Критерий однородности 𝜒2, критерий независимости 𝜒2. Тест Мак – Нимара. Точный тест Фишера.
  • Задача о регрессии и угле наклона. Метод Тейла. Оценка угла наклона методом тейла. Свободный от распределения критерий параллельности двух регрессионных прямых. Введение в ядерную регрессию.
  • Анализ выживаемости. Кривая выживаемости, оценка методом Каплана – Мейера. Критерий Гехана.
  • Понятие номинального признака. Анализ таблиц сопряженности. Величина 𝜑2. Коэффициент Кетле и 𝜑2. Метод анализа соответствий (Correspondence analysis) и эквивалентные методы оцифровки.
  • Другие темы связанные с непараметрической статистикой, интересные слушателям, которые получится успеть пройти.
Элементы контроля

Элементы контроля

  • неблокирующий Листки с ДЗ
  • неблокирующий Работа на семинарах
  • неблокирующий Индивидуальная работа
    доклад со статьей или проект
  • неблокирующий Экзамен
Промежуточная аттестация

Промежуточная аттестация

  • 2025/2026 4th module
    Порядок оценивания. ∘ДЗ - домашние задания (в виде листков). Отличие от прошлых лет, если вы посещаете НИС, то сдачу можно сделать исключительно письменной. Если посещений нет или мало преподаватель может на своё усмотрение попросить вас устно защитить задачи себе или ассистенту. ∘ЭК - экзамен ∘ИР - индивидуальная работа: доклад со статьёй или проект. В некоторых случаях, если полученный в рамках проекта результат потребовал очень больших затрат и/или получившийся результат является очень значимым вес этой компоненты оценки может быть увеличен. ∘СЕМ - работа на семинарах ∘L- коэффициент посещения приглашённых лекций. Если вы посетили большую часть (> 50%) лекций приглашенных преподавателей L=1, иначе L=0.7и относительно вашей оценки перестают работать правила математического округления. Правила по дедлайнам: за сдачу заданий в течение недели после дедлайна вы получите0.8результата,а после лишь0.4. Автоматы:если по формуле(0.4⋅ДЗ+0.4⋅ИР+0.2⋅СЕМ)у вас получается≥8(без округления), то можно зачесть себе эту оценку и не ходить на экзамен
Список литературы

Список литературы

Рекомендуемая основная литература

  • Nonparametric statistical methods, Hollander, M., 2014

Рекомендуемая дополнительная литература

  • Core data analysis : summarization, correlation, and visualization, Mirkin, B., 2019

Авторы

  • Самойленко Иван Александрович