• A
  • A
  • A
  • АБB
  • АБB
  • АБB
  • А
  • А
  • А
  • А
  • А
Обычная версия сайта
Бакалавриат 2025/2026

Вероятностное моделирование в геномике

Статус: Курс обязательный (Прикладная математика и информатика)
Когда читается: 3-й курс, 3, 4 модуль
Охват аудитории: для своего кампуса
Преподаватели: Ильина Анна Васильевна
Язык: русский
Кредиты: 6
Контактные часы: 80

Программа дисциплины

Аннотация

Курс посвящен фундаментальным принципам вероятностного моделирования эволюционных процессов в популяциях и методам анализа генетических данных. В первой части рассматриваются детерминистские модели популяционной генетики: равновесие Харди–Вайнберга как базовый принцип панмиксной популяции, эффект Валунда, выявляющий скрытую структуру популяции через дефицит гетерозигот, и неравновесие по сцеплению (LD), описывающее неслучайные ассоциации аллелей между локусами. Основное внимание уделяется стохастическим процессам, лежащим в основе эволюции генетического разнообразия. Студенты изучат модель Райта–Фишера — центральную модель генетического дрейфа в конечных популяциях, понятие эффективного размера популяции, позволяющее связать реальные популяции с идеализированной моделью, и коалесцентную теорию, дающую ретроспективный взгляд на генеалогии генов. Будут рассмотрены современные обобщения коалесцентного подхода: предковые графы рекомбинации (ARG), описывающие множественные локальные генеалогии вдоль генома, марковские коалесцентные модели (SMC, SMC’), представляющие последовательность локальных деревьев как скрытую марковскую модель, а также методы локального инференса происхождения (LAI) для анализа смешанных популяций. Вторая часть посвящена современным методам молекулярной филогенетики и их применению для анализа эволюции генов и признаков. В рамках курса объясняются подходы к подготовке данных для филогенетического анализа, методы реконструкции, сравнения и оценки достоверности филогенетических деревьев, а также рассматриваются методы выявления отбора на основе филогенетической информации. Особое внимание уделяется практическим аспектам анализа: выбору моделей эволюции, тестированию филогенетических гипотез, а также применению методов филогенетики для решения практических задач.
Цель освоения дисциплины

Цель освоения дисциплины

  • Знать фундаментальные принципы популяционной генетики: равновесие Харди–Вайнберга, эффект Валунда, неравновесие по сцеплению и их роль в анализе генетической изменчивости
  • Понимать структуру и ограничения модели Райта–Фишера как базовой стохастической модели генетического дрейфа, уметь выводить её основные свойства (вероятность фиксации, скорость убывания гетерозиготности)
  • Владеть понятием эффективного размера популяции и методами его оценки для реальных популяций с учётом демографических факторов
  • Знать основы коалесцентной теории: распределение времени коалесценции, TMRCA, общую длину ветвей, связь с параметром θ = 4Nµ
  • Уметь применять статистические методы оценки популяционных параметров и интерпретировать спектр частот аллелей
  • Понимать современные обобщения коалесцентного подхода: предковые графы рекомбинации (ARG) как полное описание истории выборки, марковские коалесцентные модели (SMC, SMC’) и их роль в эффективном инференсе
  • Знать принципы методов локального инференса происхождения для анализа смешанных популяций и их применение в картировании генов
  • Уметь применять статистические тесты для проверки равновесных состояний и обнаружения отклонений от нейтральности
  • Понимать принципы выбора данных для проведения филогенетического анализа
  • Понимать принципы построения выравниваний последовательностей, уметь строить и интерпретировать множественные выравнивания
  • Знать основные модели эволюции последовательностей и уметь выбирать адекватные задаче модели
  • Знать принципы популярных методов реконструкции филогении и предковых признаков, понимать их ограничения
  • Уметь оценивать статистическую поддержку филогенетических гипотез
  • Владеть базовыми навыками работы с программным обеспечением для реконструкции и визуализации филогенетических деревьев
  • Знать теоретические основы подходов к выявлению отбора
  • Знать возможности применения филогенетических методов в задачах сравнительной геномики, поиска ассоциаций генотип-фенотип, эпидемиологии
Планируемые результаты обучения

Планируемые результаты обучения

  • Знать математический аппарат описания генетического дрейфа: биномиальные переходные вероятности, мартингальные свойства, рекуррентные соотношения для гетерозиготности и коэффициента инбридинга
  • Уметь рассчитывать равновесные частоты генотипов в панмиксной популяции, проверять соответствие наблюдаемых частот равновесию Харди–Вайнберга
  • Владеть методами диагностики скрытой структуры популяции через анализ дефицита гетерозигот и расчёт FST
  • Уметь моделировать динамику неравновесия по сцеплению под действием рекомбинации, понимать связь частоты рекомбинации с генетическим расстоянием
  • Знать распределение времени коалесценции для выборки из n генов и уметь вычислять ожидаемые значения TMRCA и общей длины ветвей
  • Понимать связь между топологией коалесцентного дерева, спектром частот аллелей и знаком теста Таджимы D для различных демографических сценариев
  • Уметь интерпретировать предковые графы рекомбинации как последовательность локальных деревьев вдоль генома и понимать роль рекомбинационных событий в формировании генетического разнообразия
  • Знать принципы работы марковских коалесцентных моделей (SMC, SMC’) как приближений полного ARG, позволяющих эффективно обрабатывать полногеномные данные
  • Владеть базовыми представлениями о методах локального инференса происхождения и их применении для анализа смешанных популяций, картирования генов и обнаружения следов отбора
  • Уметь применять полученные знания для интерпретации результатов современных геномных исследований, включая демографические реконструкции и поиск генов под действием отбора
  • Знать базовые алгоритмы построения попарных и множественных выравниваний
  • Уметь выбирать ортологичные гены, применять методы множественного выравнивания и фильтрации данных для подготовки последовательностей к филогенетическому анализу, оценивать качество выравнивания
  • Знать принципы построения филогенетических деревьев дистанционными (UPGMA, NJ) и символьными (на основе парсимонии, ML и байесовского подхода) методами, уметь обоснованно выбирать модель эволюции и интерпретировать длины ветвей
  • Знать статистические тесты для сравнения альтернативных топологических гипотез (SH-тест, AU-тест) и уметь применять их для проверки эволюционных сценариев
  • Уметь оценивать достоверность узлов дерева с помощью бутстрепа и анализа консенсусных деревьев, уметь диагностировать конфликты между генными деревьями и обнаруживать рекомбинацию
  • Знать принципы подходов к выявлению следов положительного отбора (расчёт dN/dS, тест Макдональда–Крейтмана, сайт-специфические и ветвь-специфические модели FEL, MEME, BUSTED), уметь применять тесты на отбор в программах HyPhy и MEGA
  • Знать принципы реконструкции дискретных и непрерывных предковых состояний
  • Знать принципы молекулярной датировки: строгие и расслабленные часы, калибровка по ископаемым и геологическим событиям, источники неопределённости
  • Уметь оценивать филогенетический сигнал в фенотипических признаках (Pagel’s λ), применять PGLS для изучения корреляций признаков с учётом эволюционных зависимостей, понимать роль учёта филогенетической структуры для контроля ложных ассоциаций
Содержание учебной дисциплины

Содержание учебной дисциплины

  • Равновесие Харди-Вайнберга
  • Эффект Валунда
  • Мультилокусное равновесие. LD
  • Модель Райта-Фишера
  • Эффективный размер популяции
  • Коалесцентная теория
  • Предковые графы рекомбинации ARG
  • Марковские коалесцентные модели
  • Методы локального инференса (LAI)
  • Основные понятия молекулярной филогенетики
  • Построение выравниваний
  • Филогенетическая реконструкция: дистанционные методы
  • Филогенетическая реконструкция: символьные методы
  • Оценка достоверности и тестирование топологических гипотез
  • Поиск отбора
  • Восстановление предковых состояний и датировка
Элементы контроля

Элементы контроля

  • неблокирующий Домашнее задание 1-6
  • неблокирующий Домашнее задание на работу с реальными геномными данными
  • неблокирующий Контрольная работа 1
  • неблокирующий Экзамен
  • неблокирующий Домашнее задание по молекулярной филогенетике
  • неблокирующий Контрольная работа 2
Промежуточная аттестация

Промежуточная аттестация

  • 2025/2026 4th module
    Итог = Округление(0.5*O1 + 0.5*O2), О1 = 0.3*КР1+0.6*ДЗ_3+0.1*ДЗ_данные О2 = 0.1*КР2 + 0.3*Экзамен + 0.6*ДЗ_4 где • КР1 — оценка за Контрольную работу 1 по третьему модулю • ДЗ_3 — оценка за домашние задания по третьему модулю • ДЗ данные — оценка за домашнее задание по работе с данными по третьему модулю • КР2 — оценка за Контрольную работу по четвертому модулю • Экзамен — оценка за экзамен по четвертому модулю • ДЗ_4 — оценка за домашние задания по четвертому модулю
Список литературы

Список литературы

Рекомендуемая основная литература

  • Абдукаева, Н. С. Деление клетки. Генетика. Молекулярная биология : учебное пособие / Н. С. Абдукаева, Н. С. Косенкова, Н. В. Васильева. — Санкт-Петербург : СПбГПМУ, 2021. — 60 с. — ISBN 978-5-907565-08-1. — Текст : электронный // Лань : электронно-библиотечная система. — URL: https://e.lanbook.com/book/255791 (дата обращения: 00.00.0000). — Режим доступа: для авториз. пользователей.

Рекомендуемая дополнительная литература

  • Кельберт, М. Я. Вероятность и статистика в примерах и задачах : учебное пособие / М. Я. Кельберт, Ю. И. Сухов. — Москва : МЦНМО, [б. г.]. — Том 2 : Марковские цепи как отправная точка теории случайных процессов — 2010. — 560 с. — ISBN 978-5-94057-557-3. — Текст : электронный // Лань : электронно-библиотечная система. — URL: https://e.lanbook.com/book/9354 (дата обращения: 00.00.0000). — Режим доступа: для авториз. пользователей.

Авторы

  • Щур Владимир Львович
  • Кононова Елизавета Дмитриевна