• A
  • A
  • A
  • АБB
  • АБB
  • АБB
  • А
  • А
  • А
  • А
  • А
Обычная версия сайта
Бакалавриат 2025/2026

Научно-исследовательский семинар "Генеративные модели ИИ в биологии"

Язык: русский
Кредиты: 4
Контактные часы: 60

Программа дисциплины

Аннотация

НИС «Генеративные модели ИИ в биологии» посвящен внедрению современных технологий искусственного интеллекта в биологические исследования и практику. Участники курса познакомятся с основами генеративных моделей и их применением для решения актуальных задач в области биологии, включая анализ геномных данных и обработку биологических и медицинских изображений. Особое внимание будет уделено использованию нейросетей в повседневной деятельности биологов. Рассмотрим практические аспекты разработки презентаций и научных постеров с помощью ИИ, создание личных ИИ-помощников для повышения эффективности работы, а также использование инструментов ИИ для работы с информацией и написания текстов. Участники получат навыки, которые помогут им внедрять ИИ в проектную деятельность, оптимизируя процессы исследований. НИС также сосредоточится на методах генерации новых гипотез и идей, основанных на анализе существующих данных, что является важной частью научного процесса. Участники смогут узнать, как генеративные модели могут быть использованы для моделирования биологических процессов, что откроет новые горизонты понимания и экспериментов в биологии. Наконец, важной темой НИС станут этика и правовые аспекты использования генеративных моделей в научных исследованиях. Участники познакомятся с проблемами, связанными с ответственным и этичным использованием ИИ в науке, что будет способствовать формированию сознательного подхода к внедрению технологий. Курс предназначен для студентов и специалистов в области биологии, желающих освоить методы и инструменты ИИ для улучшения качества своих исследований, повышения продуктивности и расширения горизонтов научной деятельности.
Цель освоения дисциплины

Цель освоения дисциплины

  • • сформировать у слушателей практических и систематических навыков анализа биомедицинских данных; • сформировать представления о применении современных технологий обработки биомедицинской информации; • познакомить слушателей с основными принципами и приёмами статистической обработки данных • научить слушателей основным понятиям и постановкам задач машинного обучения, возникающих в биологических и биомедицинских задачах; • дать теоретические основы ключевых методов машинного обучения; • познакомить с принципами построения композиций моделей машинного обучения; • познакомить с основными метриками качества для регрессии и классификации; • научить выполнять полный цикл построения модели; • научить обучать основные модели машинного обучения, оценивать их качество; • научить выполнять кластеризацию и визуализацию данных; • дать базовые знания об архитектурах искусственных нейронных сетей, базовых методах их обучения и оценки качества.
Планируемые результаты обучения

Планируемые результаты обучения

  • Умение выполнять полный цикл построения модели
  • Знание медицинских приложений анализа данных, основных баз медико-биологических данных, иных источников и способов извлечения данных из них;
  • Знание основных понятий математической статистики (нулевая и альтернативная гипотеза, ошибки первого и второго рода, статистический критерий (тест), уровень значимости, статистика как функция от выборки, критическое множество, мощность критерия, p-значение, описательные характеристики выборки);
  • Владение основными приёмами описательной статистики, в том числе числовые статистическими характеристиками набора числовых данных и приёмами визуализации эмпирических распределений;
  • Умение проверять гипотезы на основе статистических данных;
  • Владение статистическими методами, применяемыми для анализа медицинской информации, и соответствующим прикладным программным обеспечением;
  • Умение обосновать выбор метода исследования применительно к поставленным задачам;
  • Умение строить точечные и интервальные оценки необходимых параметров на основе статистических данных;
  • Умение интерпретировать результаты анализа данных;
  • Знание основных понятий, постановки и метрик качества задач машинного обучения ключевых типов;
  • Знание теоретических основ методов машинного обучения;
  • Умение выполнять кластеризацию и визуализацию данных;
  • Умение обучать основные модели машинного обучения, оценивать их качество;
  • Знание основных видов и архитектур искусственных нейронных сетей и подходов к их обучению;
  • Способность применять методы машинного обучения и методы оптимизации к задаче определения пространственной структуры белковых структур;
  • Умение работать с Python-модулем Biopython, имеет представление о базовой структуре каркаса белковой молекулы;
  • Умение пользоваться инструментом AlphaFold для моделирования пространственной структуры белка;
  • Знание основных видов и архитектур искусственных нейронных сетей и подходов к их обучению.
Содержание учебной дисциплины

Содержание учебной дисциплины

  • Введение в анализ данных
  • Основы математической статистики
  • Введение в машинное обучение. Основные термины, постановки задач и примеры применения.
  • Регрессионные методы и модели
  • Методы классификации.
  • Решающие деревья и композиции моделей
  • Обучение без учителя и кластеризация
  • Основы искусственных нейронных сетей
  • Введение в задачи компьютерного зрения в биологии и медицине
  • Трансформеры: основа архитектуры и применение в биоинформатике.
  • Обзор ИИ-инструментов для биологии и медицины
Элементы контроля

Элементы контроля

  • неблокирующий Домашнее задание
  • неблокирующий Контрольная работа
Промежуточная аттестация

Промежуточная аттестация

  • 2025/2026 2nd module
    0.45 * Домашнее задание + 0.45 * Контрольная работа + 0.1 * Контрольная работа
Список литературы

Список литературы

Рекомендуемая основная литература

  • Hastie, T., Tibshirani, R., & Friedman, J. H. (2009). The Elements of Statistical Learning : Data Mining, Inference, and Prediction (Vol. Second edition, corrected 7th printing). New York: Springer. Retrieved from http://search.ebscohost.com/login.aspx?direct=true&site=eds-live&db=edsebk&AN=277008
  • Python для сложных задач: наука о данных и машинное обучение. - 978-5-4461-0914-2 - Плас Дж. Вандер - 2021 - Санкт-Петербург: Питер - https://ibooks.ru/bookshelf/376830 - 376830 - iBOOKS
  • Rogers, S., & Girolami, M. (2016). A First Course in Machine Learning (Vol. 2nd ed). Milton: Chapman and Hall/CRC. Retrieved from http://search.ebscohost.com/login.aspx?direct=true&site=eds-live&db=edsebk&AN=1399490
  • Золкин, А. Л. Основы алгоритмизации, мировые информационные ресурсы, медико-биологическая статистика : учебное пособие / А. Л. Золкин. — Самара : , 2022 — Часть 1 — 2022. — 161 с. — ISBN 978-5-907359-09-3. — Текст : электронный // Лань : электронно-библиотечная система. — URL: https://e.lanbook.com/book/326534 (дата обращения: 00.00.0000). — Режим доступа: для авториз. пользователей.

Рекомендуемая дополнительная литература

  • Witten, I. H., Frank, E., Hall, M. A., & Pal, C. J. (2017). Data Mining : Practical Machine Learning Tools and Techniques (Vol. Fourth edition). Cambridge, MA: Morgan Kaufmann. Retrieved from http://search.ebscohost.com/login.aspx?direct=true&site=eds-live&db=edsebk&AN=1214611

Авторы

  • Мартынова Ольга Владимировна
  • Яхина Мария Рафаиловна
  • Вартанов Сергей Александрович