Бакалавриат
2025/2026





Python и основы анализа данных
Статус:
Курс обязательный (Прикладная математика и информатика)
Кто читает:
Базовая кафедра Яндекс
Где читается:
Факультет компьютерных наук
Когда читается:
1-й курс, 2 модуль
Охват аудитории:
для своего кампуса
Преподаватели:
Бронер Валентина Игоревна
Язык:
русский
Кредиты:
4
Контактные часы:
56
Программа дисциплины
Аннотация
Дисциплина предназначена для начинающих и знакомит с основами программирования на Python, а также его применением в анализе данных. Участники освоят ключевые библиотеки, такие как Pandas, NumPy и Matplotlib, научатся обрабатывать, визуализировать и анализировать данные, работать с файлами и выполнять простые статистические расчёты. Курс сочетает теорию с практическими заданиями, помогая развить навыки, необходимые для дальнейшего изучения Data Science и аналитики. Подходит для всех, кто хочет начать работать с данными, используя Python.
Цель освоения дисциплины
- Умение проводить базовый анализ данных
- Работа с базами данных на продвинутом уровне с помощью Python
- Создание веб-страничек и их форматирование
- Навык визуализации с помощью Python
- Умение писать асинхронные и мультипроцессинговые скрипты
- Умение работать с API
- Создание телеграм-ботов
Планируемые результаты обучения
- Умение писать асинхронные и мультипроцессинговые скрипты
- Умение работать с API
- Создание телеграм-ботов
Содержание учебной дисциплины
- Знакомство с курсом. Знакомство с языком. Условные операторы, циклы.
- Базовые управляющие конструкции. Типы данных. Динамическая типизация. Duck typing. Базовый ввод-вывод. Примеры программ
- Мутабельность и иммутабельность.
- Строки. Format, replace. Кодировки: Uft-8.
- Декомпозиция. Понятие функции. Рекурсия (стеклимит)
- Работа со структурами данных. Списки, кортежи, множества, словари. Итераторы и генераторы. Неймспейсы, декораторы? 2 недели? + split, join строк
- Работа с файловой системой. Файлы-конфиги. Переменные окружения.
- Модули и пакеты. Экосистема библиотек. requirements.txt
- ООП в Python. Классы и объекты, наследование. Исключения.
- NumPy. Основы NumPy, операции с массивами. Использование NumPy для научных вычислений. LinAlg | ScaLAPACK
- Специфические форматы данных: ZIP, GZIP, numpy-file
- Стандарт формата JSON, XML
- Pandas. Работа с датасетами. JSON, CSV, EXCEL. Основы работы с DataFrame и Series. Очистка, трансформация данных.
- Визуализация данных. Основы Matplotlib и Seaborn. Построение графиков, интерпретация данных. Анимация, видео.
- БД/SQL
- Продвинутое использование Pandas. Сложные манипуляции с данными. Агрегирование, слияние данных
- Введение в параллелизм на Python. Http-клиенты. requests
- Формат HTML, парсинг c BeautifulSoup
- Основы работы с изображениями. OpenCV
- Хранение данных. Введение в работу с реляционными СУБД
- Мультипроцессинг/мультитрединг
- Корутины, async/await, asyncio
Элементы контроля
- Большое ДЗ1000 баллов каждое + бонусные баллы, не входящие в итоговый порог
- Еженедельные заданияоколо 15 еженедельных наборов задач (примерно по 100 баллов каждый, могут плавать от занятия к занятию)
Промежуточная аттестация
- 2025/2026 2nd moduleКонтроль знаний формируется из еженедельных наборов задач и двух больших домашних заданий. Количество баллов за каждое домашние задание обозначается в формулировках. Баллы суммируются по всем заданиям. Полученная сумма называется первичными баллами Итоговая оценка формируется на основании следующих порогов: >= 970 первичных баллов: 4 балла >=1106 первичных баллов: 5 баллов >=1261 первичных баллов: 6 баллов >=1397 первичных баллов: 7 баллов >=1552 первичных баллов: 8 баллов >=1649 первичных баллов: 9 баллов >=1746 первичных баллов: 10 баллов
Список литературы
Рекомендуемая основная литература
- Сборник задач по алгебре, учебник, под ред. А. И. Кострикина, 3-е изд., испр. и доп., 464 с., , 2001
Рекомендуемая дополнительная литература
- Маккинни, У. Python и анализ данных / У. Маккинни , перевод с английского А. А. Слинкина. — 2-ое изд., испр. и доп. — Москва : ДМК Пресс, 2020. — 540 с. — ISBN 978-5-97060-590-5. — Текст : электронный // Лань : электронно-библиотечная система. — URL: https://e.lanbook.com/book/131721 (дата обращения: 00.00.0000). — Режим доступа: для авториз. пользователей.