Бакалавриат
2025/2026
Хемометрика и хемоинформатика
Статус:
Курс обязательный (Химия)
Кто читает:
Базовая кафедра элементоорганической химии Института элементоорганических соединений им. А.Н. Несмеянова РАН
Когда читается:
3-й курс, 3, 4 модуль
Охват аудитории:
для своего кампуса
Преподаватели:
Злобин Иван Сергеевич
Язык:
русский
Программа дисциплины
Аннотация
Курс представляет собой введение в современные методы и области использования искусственного интеллекта для анализа химических данных. В блоке «Хемометрика» будут рассмотрены подходы к планированию и проведению аналитического эксперимента, автоматического сбора и агрегации результатов опытов, дизайну и построению статистических моделей анализа и визуализации экспериментальных данных в химии, включающим в себя уменьшение размерности данных, кластеризацию, классификацию и многомерную регрессию при помощи инструментария Python и методов машинного обучения. Блок «Хемоинформатика» посвящен использованию искусственного интеллекта для разработки компьютерных методов работы со структурной химической информацией, включая создание и оперирование химическими базами данных и установление и моделирование связи между структурами химических соединений и их свойствами. Для решения задач хемометрики и хемоинформатики будут рассмотрены и применены на практике традиционные подходы машинного обучения, такие как линейная регрессия с регуляризацией, деревья решений, случайный лес и градиентный бустинг; а также подходы глубинного обучения, такие как полносвязные, рекуррентные и сверточные нейронные сети. Курс рассчитан на студентов, обладающих базовыми навыками работы в python (владение основными структурами данных, такими как list, dict, tuple, array; подключение внешних библиотек; реализация арифметических операций, циклов, функций и классов; чтение внешних файлов и запись информации в них), представлениями о результатах аналитических экспериментов (вольтамперометрия, масс-спектрометрия, спектрофотометрия, ЯМР-спектроскопия, рентгеноструктурный анализ) и владеющими основными инструментами математического анализа, линейной алгебры и математической статистики (функция многих переменных, оператор набла (градиент, дивергенция, ротор), комплекснозначная функция, преобразование Фурье, операции над векторами/тензорами, линейное отображение, собственные вектора, системы линейных алгебраических уравнений, стандартное отклонение, методы построения статистических оценок, функция плотности распределения центральная предельная теорема).