• A
  • A
  • A
  • АБB
  • АБB
  • АБB
  • А
  • А
  • А
  • А
  • А
Обычная версия сайта
Магистратура 2025/2026

Основы программирования в R и Python

Когда читается: 1-й курс, 1, 2 модуль
Охват аудитории: для своего кампуса
Язык: русский
Контактные часы: 56

Программа дисциплины

Аннотация

Дисциплина преподается с целью ознакомления студентов-биотехнологов с основами программирования на языках Python и R для автоматизации обработки экспериментальных данных и репродуцируемого анализа результатов. Курс нацелен на приобретение практических навыков написания скриптов для решения конкретных биотехнологических задач: анализа данных спектрофотометрии, qPCR и NGS, работы с научными базами данных, а также построения автоматизированных вычислительных пайплайнов.
Цель освоения дисциплины

Цель освоения дисциплины

  • Целью освоения дисциплины является формирование у студентов-биотехнологов компетенций в области программирования на Python и R для автоматизации обработки экспериментальных данных, построения воспроизводимых вычислительных пайплайнов и решения практических задач в области биотехнологий.
Планируемые результаты обучения

Планируемые результаты обучения

  • Знать Базовый синтаксис и основные структуры данных языков Python и R
  • Знать Принципы работы с ключевыми библиотеками для обработки данных (pandas, dplyr) и визуализации (matplotlib, seaborn, ggplot2)
  • Знать Основы работы с системой контроля версий Git и принципы репродуцируемого анализа
  • Знать Методы доступа к внешним данным через REST API
  • Знать Основные концепции построения автоматизированных пайплайнов анализа данных (на примере Snakemake/Nextflow)
  • Уметь писать, запускать и отлаживать скрипты на Python и R для автоматизации рутинных задач
  • Уметь загружать, обрабатывать и очищать данные из файлов (CSV, TXT, JSON) и внешних источников (на примере PubMed)
  • Уметь создавать статичные и публикационные графики для визуального анализа и представления результатов
  • Уметь организовывать совместную работу над кодом с использованием Git (создание репозиториев, коммитов, pull request'ов)
  • Уметь проектировать простые воспроизводимые вычислительные пайплайны с изолированными окружениями
  • Уметь интегрировать код на Python и R в рамках единого рабочего процесса
  • Владеть навыками программирования на Python и R для анализа биологических данных
  • Владеть навыками автоматизации процессов обработки данных с помощью bash-скриптов и функций
  • Владеть технологиями визуализации данных для интерпретации и презентации научных результатов
  • Владеть методами работы с системой контроля версий Git для обеспечения воспроизводимости исследований
  • Владеть навыками создания базовых пайплайнов для организации комплексного анализа данных
Содержание учебной дисциплины

Содержание учебной дисциплины

  • Введение в программирование для биотехнологии
  • Основы синтаксиса Python
  • Коллекции и логика в Python
  • Работа с файлами и данными в Python
  • Инструменты и best practices разработчика на Python
  • Визуализация данных в Python
  • Работа с интернетом и API
  • Основы синтаксиса R
  • Обработка данных в R
  • Инструменты и reproducible reporting в R
  • Визуализация данных в R
  • Интеграция языков: командная строка Bash, Python и R
  • Контроль версий с помощью Git
  • Построение воспроизводимых пайплайнов
  • Использование LLM (ChatGPT, Copilot) в разработке кода
  • Интеграция знаний. Мини-проект
Элементы контроля

Элементы контроля

  • неблокирующий Домашнее задание
    Практические задания, основанные на разборе "живых" биотех-кейсов с занятий. Направлены на отработку навыков программирования для решения конкретных прикладных задач.
  • неблокирующий Квиз
    Короткие тестовые задания (с выбором ответа, на соответствие, написание короткого фрагмента кода) для проверки понимания синтаксиса и ключевых концепций.
  • неблокирующий Мини-проект/Контрольная работа
    Самостоятельная работа по созданию небольшого законченного проекта на выбранную тему (напр., парсинг BLAST, анализ кривых роста, скрининг PubChem). Включает код, документацию и устную защиту.
Промежуточная аттестация

Промежуточная аттестация

  • 2025/2026 2nd module
    0.7 * Домашнее задание + 0.14 * Квиз + 0.16 * Мини-проект/Контрольная работа
Список литературы

Список литературы

Рекомендуемая основная литература

  • Hetland, M. L. (2017). Beginning Python : From Novice to Professional (Vol. Third edition). New York: Apress. Retrieved from http://search.ebscohost.com/login.aspx?direct=true&site=eds-live&db=edsebk&AN=1174463
  • Python для data science, Васильев, Ю., 2023

Рекомендуемая дополнительная литература

  • McKinney, W. (2018). Python for Data Analysis : Data Wrangling with Pandas, NumPy, and IPython (Vol. Second edition). Sebastopol, CA: O’Reilly Media. Retrieved from http://search.ebscohost.com/login.aspx?direct=true&site=eds-live&db=edsebk&AN=1605925
  • Python 3, Прохоренок, Н. А., 2016
  • Программируем на Python, Доусон, М., 2015

Авторы

  • Емашева Валерия Анатольевна