Бакалавриат
2025/2026




Научно-исследовательский семинар "Машинное обучение для решения биологических и биомедицинских задач"
Статус:
Курс обязательный (Клеточная и молекулярная биотехнология)
Кто читает:
Базовая кафедра Института биоорганической химии им. академиков М.М. Шемякина и Ю.А. Овчинникова РАН
Где читается:
Факультет биологии и биотехнологии
Когда читается:
4-й курс, 1, 2 модуль
Охват аудитории:
для своего кампуса
Язык:
русский
Кредиты:
3
Программа дисциплины
Аннотация
НИС нацелен на изучение современных методов машинного обучения и их применения в биологии и медицине. Студенты ознакомятся с основными концепциями и алгоритмами машинного обучения, а также с их специфическими приложениями в различных областях биологических исследований.
В рамках курса акцент будет сделан на таких ключевых темах, как:
- **Single Cell Анализ**: Исследование одноядерных клеток является важным аспектом современной биологии. Участники изучат методы обработки и анализа данных одноядерной секвенирования (scRNA-seq), а также применение кластеризации и снижения размерности для выявления клеточных подтипов и понимания клеточных функций на индивидуальном уровне.
- **Трансформеры**: Участники познакомятся с архитектурой трансформеров и их применением в биоинформатике, включая анализ последовательностей ДНК и белков. Мы рассмотрим, как трансформеры могут быть использованы для предсказания структурных особенностей белков и анализа геномных данных.
- **Обучение с Подкреплением**: Курс также охватит базовые принципы обучения с подкреплением и его применение для оптимизации биомедицинских исследований, таких как разработка новых лекарств и моделирование биологических процессов. Участники смогут изучить, как методы обучения с подкреплением могут помочь в принятии решений и адаптивной стратегии в динамичных биологических системах.
Каждая тема будет подкреплена практическими примерами и заданиями, что позволит студентам применять полученные знания к реальным данным и задачам. Курс предназначен для студентов и специалистов, заинтересованных в интеграции машинного обучения и биологии, а также для тех, кто стремится развивать навыки работы с современными инструментами анализа данных.
Цель освоения дисциплины
- Целями освоения дисциплины являются: • сформировать у слушателей практических и систематических навыков анализа биомедицинских данных; • сформировать представления о применении современных технологий обработки биомедицинской информации; • познакомить слушателей с основными принципами и приёмами статистической обработки данных • научить слушателей основным понятиям и постановкам задач машинного обучения, возникающих в биологических и биомедицинских задачах; • дать теоретические основы ключевых методов машинного обучения; • познакомить с принципами построения композиций моделей машинного обучения; • познакомить с основными метриками качества для регрессии и классификации; • научить выполнять полный цикл построения модели; • научить обучать основные модели машинного обучения, оценивать их качество; • научить выполнять кластеризацию и визуализацию данных; • дать базовые знания об архитектурах искусственных нейронных сетей, базовых методах их обучения и оценки качества.
Планируемые результаты обучения
- Умение проверять гипотезы на основе статистических данных
- Умение обосновать выбор метода исследования применительно к поставленным задачам
- Знание основных понятий математической статистики, владение основными приёмами описательной статистики
- Владение статистическими методами, применяемыми для анализа медицинской информации, и соответствующим прикладным программным обеспечением
Содержание учебной дисциплины
- Введение в анализ данных и основы математической статистики
- Введение в машинное обучение. Регрессия. Классификация. Решающие деревья и композиции моделей.
- Обучение без учителя. Прикладное машинное обучение. Обзор ИИ-инструментов для биологии и медицины.
Промежуточная аттестация
- 2025/2026 2nd module0.45 * Домашнее задание + 0.45 * Домашнее задание + 0.1 * Контрольная работа
Список литературы
Рекомендуемая основная литература
- Золкин, А. Л. Основы алгоритмизации, мировые информационные ресурсы, медико-биологическая статистика : учебное пособие / А. Л. Золкин. — Самара : , 2022 — Часть 1 — 2022. — 161 с. — ISBN 978-5-907359-09-3. — Текст : электронный // Лань : электронно-библиотечная система. — URL: https://e.lanbook.com/book/326534 (дата обращения: 00.00.0000). — Режим доступа: для авториз. пользователей.
Рекомендуемая дополнительная литература
- Hastie, T., Tibshirani, R., & Friedman, J. H. (2009). The Elements of Statistical Learning : Data Mining, Inference, and Prediction (Vol. Second edition, corrected 7th printing). New York: Springer. Retrieved from http://search.ebscohost.com/login.aspx?direct=true&site=eds-live&db=edsebk&AN=277008