• A
  • A
  • A
  • АБB
  • АБB
  • АБB
  • А
  • А
  • А
  • А
  • А
Обычная версия сайта
2024/2025

Научно-исследовательский семинар "Непараметрика и другие сюжеты статистики"

Лучший по критерию «Полезность курса для Вашей будущей карьеры»
Лучший по критерию «Полезность курса для расширения кругозора и разностороннего развития»
Лучший по критерию «Новизна полученных знаний»
Статус: Дисциплина общефакультетского пула
Когда читается: 3, 4 модуль
Охват аудитории: для всех кампусов НИУ ВШЭ
Язык: русский
Кредиты: 6

Программа дисциплины

Аннотация

В практических задачах часто происходят ситуации, когда распределения и зависимости в данных неизвестны, или же данные содержат мало наблюдений и много шума. В таком случае на помощь приходят непараметрические методыстатистики, базовое представление о которых будет дано в этом курсе. В рамкахкурса мы надеемся рассказать об основных непараметрических критериях проверкигипотез, а также обзорно затронуть темы, которые будут полезны при анализе медицинских, социологических и других типов данных(в том числе немного затронемизучение образования, так что надеемся увидеть в том числе и студентов с программсовместных с ЦПМ)Дополнительно, планируются лекции от приглашённых специалистов, применяющих такие статистические методы на практике (социологи, медицинские статистики,аналитики, специалисты по психометрии). О каждой из лекций будет сообщено заранее.
Цель освоения дисциплины

Цель освоения дисциплины

  • -
Планируемые результаты обучения

Планируемые результаты обучения

  • --
Содержание учебной дисциплины

Содержание учебной дисциплины

  • Задача о дихотомических данных: биномиальный критерий.
  • Одновыборочная задача о положении: анализ повторных наблюдений с помощью знаковых рангов, анализ повторных парных наблюдений с помощью знаков (свободный от распределения критерий знаков Фишера), анализ данных одной выборки.
  • Двухвыборочная задача о положении (сдвиге): свободный от распределения критерий знаковых ранговых сумм Уилкоксона, оценка Ходжес – Лемана.
  • Двухвыборочная задача о рассеянии (масштабе): свободный от распределения ранговый критерий Ансари – Брэдли, свободный от распределения критерий Мизеса.
  • Критерии согласия: 𝜒2, Колмогорова – Смирнова и др.
  • Однофакторный дисперсионный анализ: свободные от распределения критериии Краскела – Уоллиса, Джонкхиера – Терпстры
  • Двухфакторный дисперсионный анализ: свободные от распределения критерии Фридмана, Кендала и Бэбингтона Смита, свободные от распределения критерии для альтернатив с упорядочива- нием Пейджа.
  • Корелляции Пирсона, Спирмена, Кендэла. Свободный от распределения критерий независимости Кендэла.
  • Коэффициенты согласованности: альфа-кронбаха, омега-макдональда, коэффициент конкордации. Применение этих коэффициентов к анализу психометрических данных.
  • Сравнение двух вероятностей успеха (таблицы сопряжённости). Критерий однородности 𝜒2, критерий независимости 𝜒2. Тест Мак – Нимара. Точный тест Фишера.
  • Задача о регрессии и угле наклона. Метод Тейла. Оценка угла наклона методом тейла. Свободный от распределения критерий параллельности двух регрессионных прямых. Введение в ядерную регрессию.
  • Анализ выживаемости. Кривая выживаемости, оценка методом Каплана – Мейера. Критерий Гехана.
  • Понятие номинального признака. Анализ таблиц сопряженности. Величина 𝜑2. Коэффициент Кетле и 𝜑2. Метод анализа соответствий (Correspondence analysis) и эквивалентные методы оцифровки.
  • Другие темы связанные с непараметрической статистикой, интересные слушателям, которые получится успеть пройти.
Элементы контроля

Элементы контроля

  • неблокирующий Активность
  • неблокирующий Доклад
  • неблокирующий ДЗ
  • неблокирующий Экзамен
Промежуточная аттестация

Промежуточная аттестация

  • 2024/2025 4th module
    Итоговая оценка равна 𝛼 ⋅ min (10; 0.5 ⋅ ДЗ + 0.3 ⋅ ЭК + 0.3 ⋅ ИР + 0.1 ⋅ СЕМ), где ∘ ДЗ — домашние задания. За сдачу задания в течение недели после дедлайна вы получите 0.8 результата, а после лишь 0.4. ∘ ЭК — экзамен. ∘ ИР — индивидуальная работа: доклад со статьёй или проект. В некоторых случаях, если полученный в рамках проекта результат потребовал очень больших затрат и/или получившийся результат является очень значимым вес этой компоненты оценки может быть увеличен. ∘ СЕМ — работа на семинарах. ∘ 𝛼 — коэффициент посещения лекций приглашённых докладчиков. Если Вы посетили большую их часть, то 𝛼 = 1, иначе 𝛼 = 0.7 и относительно Вашей оценки перестают работать правила математического округления. Если перед экзаменом 0.4⋅ДЗ+0.4⋅ИР+0.2⋅СЕМ ≥ 8 (без округления), то можно зачесть себе эту оценку в качестве итоговой и не ходить на экзамен.
Список литературы

Список литературы

Рекомендуемая основная литература

  • Nonparametric statistical methods, Hollander, M., 2014

Рекомендуемая дополнительная литература

  • Core data analysis : summarization, correlation, and visualization, Mirkin, B., 2019

Авторы

  • Иконописцева Юлия Вахтанговна
  • Миркин Борис Григорьевич
  • Самойленко Иван Александрович