2024/2025

Научно-исследовательский семинар "Непараметрика и другие сюжеты статистики"
Лучший по критерию «Полезность курса для Вашей будущей карьеры»
Лучший по критерию «Полезность курса для расширения кругозора и разностороннего развития»
Лучший по критерию «Новизна полученных знаний»
Статус:
Дисциплина общефакультетского пула
Кто читает:
Факультет математики
Где читается:
Факультет математики
Когда читается:
3, 4 модуль
Охват аудитории:
для всех кампусов НИУ ВШЭ
Преподаватели:
Самойленко Иван Александрович
Язык:
русский
Кредиты:
6
Программа дисциплины
Аннотация
В практических задачах часто происходят ситуации, когда распределения и зависимости в данных неизвестны, или же данные содержат мало наблюдений и много шума. В таком случае на помощь приходят непараметрические методыстатистики, базовое представление о которых будет дано в этом курсе. В рамкахкурса мы надеемся рассказать об основных непараметрических критериях проверкигипотез, а также обзорно затронуть темы, которые будут полезны при анализе медицинских, социологических и других типов данных(в том числе немного затронемизучение образования, так что надеемся увидеть в том числе и студентов с программсовместных с ЦПМ)Дополнительно, планируются лекции от приглашённых специалистов, применяющих такие статистические методы на практике (социологи, медицинские статистики,аналитики, специалисты по психометрии). О каждой из лекций будет сообщено заранее.
Содержание учебной дисциплины
- Задача о дихотомических данных: биномиальный критерий.
- Одновыборочная задача о положении: анализ повторных наблюдений с помощью знаковых рангов, анализ повторных парных наблюдений с помощью знаков (свободный от распределения критерий знаков Фишера), анализ данных одной выборки.
- Двухвыборочная задача о положении (сдвиге): свободный от распределения критерий знаковых ранговых сумм Уилкоксона, оценка Ходжес – Лемана.
- Двухвыборочная задача о рассеянии (масштабе): свободный от распределения ранговый критерий Ансари – Брэдли, свободный от распределения критерий Мизеса.
- Критерии согласия: 𝜒2, Колмогорова – Смирнова и др.
- Однофакторный дисперсионный анализ: свободные от распределения критериии Краскела – Уоллиса, Джонкхиера – Терпстры
- Двухфакторный дисперсионный анализ: свободные от распределения критерии Фридмана, Кендала и Бэбингтона Смита, свободные от распределения критерии для альтернатив с упорядочива- нием Пейджа.
- Корелляции Пирсона, Спирмена, Кендэла. Свободный от распределения критерий независимости Кендэла.
- Коэффициенты согласованности: альфа-кронбаха, омега-макдональда, коэффициент конкордации. Применение этих коэффициентов к анализу психометрических данных.
- Сравнение двух вероятностей успеха (таблицы сопряжённости). Критерий однородности 𝜒2, критерий независимости 𝜒2. Тест Мак – Нимара. Точный тест Фишера.
- Задача о регрессии и угле наклона. Метод Тейла. Оценка угла наклона методом тейла. Свободный от распределения критерий параллельности двух регрессионных прямых. Введение в ядерную регрессию.
- Анализ выживаемости. Кривая выживаемости, оценка методом Каплана – Мейера. Критерий Гехана.
- Понятие номинального признака. Анализ таблиц сопряженности. Величина 𝜑2. Коэффициент Кетле и 𝜑2. Метод анализа соответствий (Correspondence analysis) и эквивалентные методы оцифровки.
- Другие темы связанные с непараметрической статистикой, интересные слушателям, которые получится успеть пройти.
Промежуточная аттестация
- 2024/2025 4th moduleИтоговая оценка равна 𝛼 ⋅ min (10; 0.5 ⋅ ДЗ + 0.3 ⋅ ЭК + 0.3 ⋅ ИР + 0.1 ⋅ СЕМ), где ∘ ДЗ — домашние задания. За сдачу задания в течение недели после дедлайна вы получите 0.8 результата, а после лишь 0.4. ∘ ЭК — экзамен. ∘ ИР — индивидуальная работа: доклад со статьёй или проект. В некоторых случаях, если полученный в рамках проекта результат потребовал очень больших затрат и/или получившийся результат является очень значимым вес этой компоненты оценки может быть увеличен. ∘ СЕМ — работа на семинарах. ∘ 𝛼 — коэффициент посещения лекций приглашённых докладчиков. Если Вы посетили большую их часть, то 𝛼 = 1, иначе 𝛼 = 0.7 и относительно Вашей оценки перестают работать правила математического округления. Если перед экзаменом 0.4⋅ДЗ+0.4⋅ИР+0.2⋅СЕМ ≥ 8 (без округления), то можно зачесть себе эту оценку в качестве итоговой и не ходить на экзамен.