Магистратура
2025/2026





Основы программирования в R и Python
Статус:
Курс по выбору (Анализ данных в биологии и медицине)
Где читается:
Факультет компьютерных наук
Когда читается:
1-й курс, 1, 2 модуль
Охват аудитории:
для своего кампуса
Язык:
русский
Контактные часы:
56
Программа дисциплины
Аннотация
Дисциплина преподается с целью ознакомления студентов-биотехнологов с основами программирования на языках Python и R для автоматизации обработки экспериментальных данных и репродуцируемого анализа результатов. Курс нацелен на приобретение практических навыков написания скриптов для решения конкретных биотехнологических задач: анализа данных спектрофотометрии, qPCR и NGS, работы с научными базами данных, а также построения автоматизированных вычислительных пайплайнов.
Цель освоения дисциплины
- Целью освоения дисциплины является формирование у студентов-биотехнологов компетенций в области программирования на Python и R для автоматизации обработки экспериментальных данных, построения воспроизводимых вычислительных пайплайнов и решения практических задач в области биотехнологий.
Планируемые результаты обучения
- Знать Базовый синтаксис и основные структуры данных языков Python и R
- Знать Принципы работы с ключевыми библиотеками для обработки данных (pandas, dplyr) и визуализации (matplotlib, seaborn, ggplot2)
- Знать Основы работы с системой контроля версий Git и принципы репродуцируемого анализа
- Знать Методы доступа к внешним данным через REST API
- Знать Основные концепции построения автоматизированных пайплайнов анализа данных (на примере Snakemake/Nextflow)
- Уметь писать, запускать и отлаживать скрипты на Python и R для автоматизации рутинных задач
- Уметь загружать, обрабатывать и очищать данные из файлов (CSV, TXT, JSON) и внешних источников (на примере PubMed)
- Уметь создавать статичные и публикационные графики для визуального анализа и представления результатов
- Уметь организовывать совместную работу над кодом с использованием Git (создание репозиториев, коммитов, pull request'ов)
- Уметь проектировать простые воспроизводимые вычислительные пайплайны с изолированными окружениями
- Уметь интегрировать код на Python и R в рамках единого рабочего процесса
- Владеть навыками программирования на Python и R для анализа биологических данных
- Владеть навыками автоматизации процессов обработки данных с помощью bash-скриптов и функций
- Владеть технологиями визуализации данных для интерпретации и презентации научных результатов
- Владеть методами работы с системой контроля версий Git для обеспечения воспроизводимости исследований
- Владеть навыками создания базовых пайплайнов для организации комплексного анализа данных
Содержание учебной дисциплины
- Введение в программирование для биотехнологии
- Основы синтаксиса Python
- Коллекции и логика в Python
- Работа с файлами и данными в Python
- Инструменты и best practices разработчика на Python
- Визуализация данных в Python
- Работа с интернетом и API
- Основы синтаксиса R
- Обработка данных в R
- Инструменты и reproducible reporting в R
- Визуализация данных в R
- Интеграция языков: командная строка Bash, Python и R
- Контроль версий с помощью Git
- Построение воспроизводимых пайплайнов
- Использование LLM (ChatGPT, Copilot) в разработке кода
- Интеграция знаний. Мини-проект
Элементы контроля
- Домашнее заданиеПрактические задания, основанные на разборе "живых" биотех-кейсов с занятий. Направлены на отработку навыков программирования для решения конкретных прикладных задач.
- КвизКороткие тестовые задания (с выбором ответа, на соответствие, написание короткого фрагмента кода) для проверки понимания синтаксиса и ключевых концепций.
- Мини-проект/Контрольная работаСамостоятельная работа по созданию небольшого законченного проекта на выбранную тему (напр., парсинг BLAST, анализ кривых роста, скрининг PubChem). Включает код, документацию и устную защиту.
Промежуточная аттестация
- 2025/2026 2nd module0.7 * Домашнее задание + 0.14 * Квиз + 0.16 * Мини-проект/Контрольная работа
Список литературы
Рекомендуемая основная литература
- Hetland, M. L. (2017). Beginning Python : From Novice to Professional (Vol. Third edition). New York: Apress. Retrieved from http://search.ebscohost.com/login.aspx?direct=true&site=eds-live&db=edsebk&AN=1174463
- Python для data science, Васильев, Ю., 2023
Рекомендуемая дополнительная литература
- McKinney, W. (2018). Python for Data Analysis : Data Wrangling with Pandas, NumPy, and IPython (Vol. Second edition). Sebastopol, CA: O’Reilly Media. Retrieved from http://search.ebscohost.com/login.aspx?direct=true&site=eds-live&db=edsebk&AN=1605925
- Python 3, Прохоренок, Н. А., 2016
- Программируем на Python, Доусон, М., 2015