Бакалавриат
2025/2026




Научно-исследовательский семинар "Генеративные модели ИИ в биологии"
Статус:
Курс обязательный (Клеточная и молекулярная биотехнология)
Кто читает:
Базовая кафедра Института биоорганической химии им. академиков М.М. Шемякина и Ю.А. Овчинникова РАН
Где читается:
Факультет биологии и биотехнологии
Когда читается:
3-й курс, 1, 2 модуль
Охват аудитории:
для своего кампуса
Язык:
русский
Кредиты:
4
Контактные часы:
60
Программа дисциплины
Аннотация
НИС «Генеративные модели ИИ в биологии» посвящен внедрению современных технологий искусственного интеллекта в биологические исследования и практику. Участники курса познакомятся с основами генеративных моделей и их применением для решения актуальных задач в области биологии, включая анализ геномных данных и обработку биологических и медицинских изображений. Особое внимание будет уделено использованию нейросетей в повседневной деятельности биологов. Рассмотрим практические аспекты разработки презентаций и научных постеров с помощью ИИ, создание личных ИИ-помощников для повышения эффективности работы, а также использование инструментов ИИ для работы с информацией и написания текстов. Участники получат навыки, которые помогут им внедрять ИИ в проектную деятельность, оптимизируя процессы исследований.
НИС также сосредоточится на методах генерации новых гипотез и идей, основанных на анализе существующих данных, что является важной частью научного процесса. Участники смогут узнать, как генеративные модели могут быть использованы для моделирования биологических процессов, что откроет новые горизонты понимания и экспериментов в биологии.
Наконец, важной темой НИС станут этика и правовые аспекты использования генеративных моделей в научных исследованиях. Участники познакомятся с проблемами, связанными с ответственным и этичным использованием ИИ в науке, что будет способствовать формированию сознательного подхода к внедрению технологий.
Курс предназначен для студентов и специалистов в области биологии, желающих освоить методы и инструменты ИИ для улучшения качества своих исследований, повышения продуктивности и расширения горизонтов научной деятельности.
Цель освоения дисциплины
- • сформировать у слушателей практических и систематических навыков анализа биомедицинских данных; • сформировать представления о применении современных технологий обработки биомедицинской информации; • познакомить слушателей с основными принципами и приёмами статистической обработки данных • научить слушателей основным понятиям и постановкам задач машинного обучения, возникающих в биологических и биомедицинских задачах; • дать теоретические основы ключевых методов машинного обучения; • познакомить с принципами построения композиций моделей машинного обучения; • познакомить с основными метриками качества для регрессии и классификации; • научить выполнять полный цикл построения модели; • научить обучать основные модели машинного обучения, оценивать их качество; • научить выполнять кластеризацию и визуализацию данных; • дать базовые знания об архитектурах искусственных нейронных сетей, базовых методах их обучения и оценки качества.
Планируемые результаты обучения
- Умение выполнять полный цикл построения модели
- Знание медицинских приложений анализа данных, основных баз медико-биологических данных, иных источников и способов извлечения данных из них;
- Знание основных понятий математической статистики (нулевая и альтернативная гипотеза, ошибки первого и второго рода, статистический критерий (тест), уровень значимости, статистика как функция от выборки, критическое множество, мощность критерия, p-значение, описательные характеристики выборки);
- Владение основными приёмами описательной статистики, в том числе числовые статистическими характеристиками набора числовых данных и приёмами визуализации эмпирических распределений;
- Умение проверять гипотезы на основе статистических данных;
- Владение статистическими методами, применяемыми для анализа медицинской информации, и соответствующим прикладным программным обеспечением;
- Умение обосновать выбор метода исследования применительно к поставленным задачам;
- Умение строить точечные и интервальные оценки необходимых параметров на основе статистических данных;
- Умение интерпретировать результаты анализа данных;
- Знание основных понятий, постановки и метрик качества задач машинного обучения ключевых типов;
- Знание теоретических основ методов машинного обучения;
- Умение выполнять кластеризацию и визуализацию данных;
- Умение обучать основные модели машинного обучения, оценивать их качество;
- Знание основных видов и архитектур искусственных нейронных сетей и подходов к их обучению;
- Способность применять методы машинного обучения и методы оптимизации к задаче определения пространственной структуры белковых структур;
- Умение работать с Python-модулем Biopython, имеет представление о базовой структуре каркаса белковой молекулы;
- Умение пользоваться инструментом AlphaFold для моделирования пространственной структуры белка;
- Знание основных видов и архитектур искусственных нейронных сетей и подходов к их обучению.
Содержание учебной дисциплины
- Введение в анализ данных
- Основы математической статистики
- Введение в машинное обучение. Основные термины, постановки задач и примеры применения.
- Регрессионные методы и модели
- Методы классификации.
- Решающие деревья и композиции моделей
- Обучение без учителя и кластеризация
- Основы искусственных нейронных сетей
- Введение в задачи компьютерного зрения в биологии и медицине
- Трансформеры: основа архитектуры и применение в биоинформатике.
- Обзор ИИ-инструментов для биологии и медицины
Промежуточная аттестация
- 2025/2026 2nd module0.45 * Домашнее задание + 0.45 * Контрольная работа + 0.1 * Контрольная работа
Список литературы
Рекомендуемая основная литература
- Hastie, T., Tibshirani, R., & Friedman, J. H. (2009). The Elements of Statistical Learning : Data Mining, Inference, and Prediction (Vol. Second edition, corrected 7th printing). New York: Springer. Retrieved from http://search.ebscohost.com/login.aspx?direct=true&site=eds-live&db=edsebk&AN=277008
- Python для сложных задач: наука о данных и машинное обучение. - 978-5-4461-0914-2 - Плас Дж. Вандер - 2021 - Санкт-Петербург: Питер - https://ibooks.ru/bookshelf/376830 - 376830 - iBOOKS
- Rogers, S., & Girolami, M. (2016). A First Course in Machine Learning (Vol. 2nd ed). Milton: Chapman and Hall/CRC. Retrieved from http://search.ebscohost.com/login.aspx?direct=true&site=eds-live&db=edsebk&AN=1399490
- Золкин, А. Л. Основы алгоритмизации, мировые информационные ресурсы, медико-биологическая статистика : учебное пособие / А. Л. Золкин. — Самара : , 2022 — Часть 1 — 2022. — 161 с. — ISBN 978-5-907359-09-3. — Текст : электронный // Лань : электронно-библиотечная система. — URL: https://e.lanbook.com/book/326534 (дата обращения: 00.00.0000). — Режим доступа: для авториз. пользователей.
Рекомендуемая дополнительная литература
- Witten, I. H., Frank, E., Hall, M. A., & Pal, C. J. (2017). Data Mining : Practical Machine Learning Tools and Techniques (Vol. Fourth edition). Cambridge, MA: Morgan Kaufmann. Retrieved from http://search.ebscohost.com/login.aspx?direct=true&site=eds-live&db=edsebk&AN=1214611