Бакалавриат
2025/2026





Вероятностное моделирование в геномике
Статус:
Курс обязательный (Прикладная математика и информатика)
Где читается:
Факультет компьютерных наук
Когда читается:
3-й курс, 3, 4 модуль
Охват аудитории:
для своего кампуса
Преподаватели:
Ильина Анна Васильевна
Язык:
русский
Кредиты:
6
Контактные часы:
80
Программа дисциплины
Аннотация
Курс посвящен фундаментальным принципам вероятностного моделирования эволюционных процессов в популяциях и методам анализа генетических данных. В первой части рассматриваются детерминистские модели популяционной генетики: равновесие Харди–Вайнберга как базовый принцип панмиксной популяции, эффект Валунда, выявляющий скрытую структуру популяции через дефицит гетерозигот, и неравновесие по сцеплению (LD), описывающее неслучайные ассоциации аллелей между локусами.
Основное внимание уделяется стохастическим процессам, лежащим в основе эволюции генетического разнообразия. Студенты изучат модель Райта–Фишера — центральную модель генетического дрейфа в конечных популяциях, понятие эффективного размера популяции, позволяющее связать реальные популяции с идеализированной моделью, и коалесцентную теорию, дающую ретроспективный взгляд на генеалогии генов. Будут рассмотрены современные обобщения коалесцентного подхода: предковые графы рекомбинации (ARG), описывающие множественные локальные генеалогии вдоль генома, марковские коалесцентные модели (SMC, SMC’), представляющие последовательность локальных деревьев как скрытую марковскую модель, а также методы локального инференса происхождения (LAI) для анализа смешанных популяций.
Вторая часть посвящена современным методам молекулярной филогенетики и их применению для анализа эволюции генов и признаков. В рамках курса объясняются подходы к подготовке данных для филогенетического анализа, методы реконструкции, сравнения и оценки достоверности филогенетических деревьев, а также рассматриваются методы выявления отбора на основе филогенетической информации. Особое внимание уделяется практическим аспектам анализа: выбору моделей эволюции, тестированию филогенетических гипотез, а также применению методов филогенетики для решения практических
задач.
Цель освоения дисциплины
- Знать фундаментальные принципы популяционной генетики: равновесие Харди–Вайнберга, эффект Валунда, неравновесие по сцеплению и их роль в анализе генетической изменчивости
- Понимать структуру и ограничения модели Райта–Фишера как базовой стохастической модели генетического дрейфа, уметь выводить её основные свойства (вероятность фиксации, скорость убывания гетерозиготности)
- Владеть понятием эффективного размера популяции и методами его оценки для реальных популяций с учётом демографических факторов
- Знать основы коалесцентной теории: распределение времени коалесценции, TMRCA, общую длину ветвей, связь с параметром θ = 4Nµ
- Уметь применять статистические методы оценки популяционных параметров и интерпретировать спектр частот аллелей
- Понимать современные обобщения коалесцентного подхода: предковые графы рекомбинации (ARG) как полное описание истории выборки, марковские коалесцентные модели (SMC, SMC’) и их роль в эффективном инференсе
- Знать принципы методов локального инференса происхождения для анализа смешанных популяций и их применение в картировании генов
- Уметь применять статистические тесты для проверки равновесных состояний и обнаружения отклонений от нейтральности
- Понимать принципы выбора данных для проведения филогенетического анализа
- Понимать принципы построения выравниваний последовательностей, уметь строить и интерпретировать множественные выравнивания
- Знать основные модели эволюции последовательностей и уметь выбирать адекватные задаче модели
- Знать принципы популярных методов реконструкции филогении и предковых признаков, понимать их ограничения
- Уметь оценивать статистическую поддержку филогенетических гипотез
- Владеть базовыми навыками работы с программным обеспечением для реконструкции и визуализации филогенетических деревьев
- Знать теоретические основы подходов к выявлению отбора
- Знать возможности применения филогенетических методов в задачах сравнительной геномики, поиска ассоциаций генотип-фенотип, эпидемиологии
Планируемые результаты обучения
- Знать математический аппарат описания генетического дрейфа: биномиальные переходные вероятности, мартингальные свойства, рекуррентные соотношения для гетерозиготности и коэффициента инбридинга
- Уметь рассчитывать равновесные частоты генотипов в панмиксной популяции, проверять соответствие наблюдаемых частот равновесию Харди–Вайнберга
- Владеть методами диагностики скрытой структуры популяции через анализ дефицита гетерозигот и расчёт FST
- Уметь моделировать динамику неравновесия по сцеплению под действием рекомбинации, понимать связь частоты рекомбинации с генетическим расстоянием
- Знать распределение времени коалесценции для выборки из n генов и уметь вычислять ожидаемые значения TMRCA и общей длины ветвей
- Понимать связь между топологией коалесцентного дерева, спектром частот аллелей и знаком теста Таджимы D для различных демографических сценариев
- Уметь интерпретировать предковые графы рекомбинации как последовательность локальных деревьев вдоль генома и понимать роль рекомбинационных событий в формировании генетического разнообразия
- Знать принципы работы марковских коалесцентных моделей (SMC, SMC’) как приближений полного ARG, позволяющих эффективно обрабатывать полногеномные данные
- Владеть базовыми представлениями о методах локального инференса происхождения и их применении для анализа смешанных популяций, картирования генов и обнаружения следов отбора
- Уметь применять полученные знания для интерпретации результатов современных геномных исследований, включая демографические реконструкции и поиск генов под действием отбора
- Знать базовые алгоритмы построения попарных и множественных выравниваний
- Уметь выбирать ортологичные гены, применять методы множественного выравнивания и фильтрации данных для подготовки последовательностей к филогенетическому анализу, оценивать качество выравнивания
- Знать принципы построения филогенетических деревьев дистанционными (UPGMA, NJ) и символьными (на основе парсимонии, ML и байесовского подхода) методами, уметь обоснованно выбирать модель эволюции и интерпретировать длины ветвей
- Знать статистические тесты для сравнения альтернативных топологических гипотез (SH-тест, AU-тест) и уметь применять их для проверки эволюционных сценариев
- Уметь оценивать достоверность узлов дерева с помощью бутстрепа и анализа консенсусных деревьев, уметь диагностировать конфликты между генными деревьями и обнаруживать рекомбинацию
- Знать принципы подходов к выявлению следов положительного отбора (расчёт dN/dS, тест Макдональда–Крейтмана, сайт-специфические и ветвь-специфические модели FEL, MEME, BUSTED), уметь применять тесты на отбор в программах HyPhy и MEGA
- Знать принципы реконструкции дискретных и непрерывных предковых состояний
- Знать принципы молекулярной датировки: строгие и расслабленные часы, калибровка по ископаемым и геологическим событиям, источники неопределённости
- Уметь оценивать филогенетический сигнал в фенотипических признаках (Pagel’s λ), применять PGLS для изучения корреляций признаков с учётом эволюционных зависимостей, понимать роль учёта филогенетической структуры для контроля ложных ассоциаций
Содержание учебной дисциплины
- Равновесие Харди-Вайнберга
- Эффект Валунда
- Мультилокусное равновесие. LD
- Модель Райта-Фишера
- Эффективный размер популяции
- Коалесцентная теория
- Предковые графы рекомбинации ARG
- Марковские коалесцентные модели
- Методы локального инференса (LAI)
- Основные понятия молекулярной филогенетики
- Построение выравниваний
- Филогенетическая реконструкция: дистанционные методы
- Филогенетическая реконструкция: символьные методы
- Оценка достоверности и тестирование топологических гипотез
- Поиск отбора
- Восстановление предковых состояний и датировка
Элементы контроля
- Домашнее задание 1-6
- Домашнее задание на работу с реальными геномными данными
- Контрольная работа 1
- Экзамен
- Домашнее задание по молекулярной филогенетике
- Контрольная работа 2
Промежуточная аттестация
- 2025/2026 4th moduleИтог = Округление(0.5*O1 + 0.5*O2), О1 = 0.3*КР1+0.6*ДЗ_3+0.1*ДЗ_данные О2 = 0.1*КР2 + 0.3*Экзамен + 0.6*ДЗ_4 где • КР1 — оценка за Контрольную работу 1 по третьему модулю • ДЗ_3 — оценка за домашние задания по третьему модулю • ДЗ данные — оценка за домашнее задание по работе с данными по третьему модулю • КР2 — оценка за Контрольную работу по четвертому модулю • Экзамен — оценка за экзамен по четвертому модулю • ДЗ_4 — оценка за домашние задания по четвертому модулю
Список литературы
Рекомендуемая основная литература
- Абдукаева, Н. С. Деление клетки. Генетика. Молекулярная биология : учебное пособие / Н. С. Абдукаева, Н. С. Косенкова, Н. В. Васильева. — Санкт-Петербург : СПбГПМУ, 2021. — 60 с. — ISBN 978-5-907565-08-1. — Текст : электронный // Лань : электронно-библиотечная система. — URL: https://e.lanbook.com/book/255791 (дата обращения: 00.00.0000). — Режим доступа: для авториз. пользователей.
Рекомендуемая дополнительная литература
- Кельберт, М. Я. Вероятность и статистика в примерах и задачах : учебное пособие / М. Я. Кельберт, Ю. И. Сухов. — Москва : МЦНМО, [б. г.]. — Том 2 : Марковские цепи как отправная точка теории случайных процессов — 2010. — 560 с. — ISBN 978-5-94057-557-3. — Текст : электронный // Лань : электронно-библиотечная система. — URL: https://e.lanbook.com/book/9354 (дата обращения: 00.00.0000). — Режим доступа: для авториз. пользователей.