Магистратура
2025/2026



Инструменты анализа данных
Статус:
Курс обязательный (Анализ данных в девелопменте)
Где читается:
Факультет компьютерных наук
Когда читается:
1-й курс, 1, 2 модуль
Охват аудитории:
для своего кампуса
Преподаватели:
Горденко Мария Константиновна
Язык:
русский
Контактные часы:
56
Программа дисциплины
Аннотация
В результате освоения дисциплины будут изучены современные методы анализа данных для проведения исследований. Студенты овладеют практическими навыками использования возможностей языка Python для работы с данными. Студенты смогут осуществлять предварительную подготовку данных для последующей работы с ними, выбрать подходящий метод анализа в зависимости от типа данных и исследовательской задачи, провести анализ данных и интерпретировать полученные результаты, представить их в доступном для широкой аудитории виде. Целью этого курса является развитие навыков программирования и создание крепкой практической базы для анализа и презентации данных.
Цель освоения дисциплины
- Формирование у студентов знаний и навыков в области анализа данных с использованием языка Python, формирование умений осуществлять обработку, анализ и интерпретацию данных для решения исследовательских задач с представлением в понятной и наглядной форме.
Планируемые результаты обучения
- Знать основные конструкции языка Python
- Знать основы работы с данными: типы данных, структуры, файлы, таблицы
- Знать методы сбора данных парсинг, API, автоматизация
- Знать базовые подходы к анализу данных и разведывательному анализу (EDA)
- Знать инструменты визуализации данных (matplotlib, seaborn)
- Знать основы работы с текстовыми данными и элементами NLP
- Уметь использовать Python для решения задач обработки и анализа данных
- Уметь работать с массивами и таблицами в библиотеках NumPy и Pandas
- Уметь собирать данные с веб-ресурсов (скрейпинг, API, Selenium)
- Уметь применять регулярные выражения для обработки текстов
- Уметь строить визуализации для интерпретации и презентации результатов анализа
- Уметь создавать простые приложения на Python (в том числе Telegram-ботов с подключением баз данных)
- Владеть навыками разработки и отладки программного кода на Python
- Владеть приёмами предобработки данных, их очистки и трансформации
- Владеть методами анализа данных в зависимости от их типа и поставленной задачи
- Владеть практикой интеграции данных из разных источников и подготовки итоговой аналитической презентации
- Владеть опытом командной и проектной работы в сфере анализа данных
Содержание учебной дисциплины
- Введение в Python, Jupyter. Ввод-вывод, основные типы данных (int, float, str).
- Логические переменные, операции и операторы сравнения. Условия if-elif-else. Условный цикл while. Списки, кортежи, последовательности
- Цикл for. Вложенный цикл for
- Текстовые файлы и таблицы
- Классы и основы ООП
- Телеграм-бот на Python. Работа с SQL и базами данных с помощью Python.
- Введение в numpy. Работа с векторами и матрицами. Введение в pandas
- Pandas. Разведывательный анализ данных
- Сбор данных: requests, BeautifulSoup – продолжение
- Сбор данных: Selenium, работа с сервисами через API
- Визуализация в seaborn. EDA особенности
- Предобработка текстов: лемматизация, удаление стоп-слов
- Работа с API различных сервисов.
Элементы контроля
- Домашнее заданиеАвтоматически проверяемые задания на написание кода и/или задание на обработку данных, сдаваемые преподавателю
- ПроектКомплексное задание на проверку навыков парсинга
- ЭкзаменАвтоматически проверяемые задания на написание кода и/или задание на обработку данных, сдаваемые преподавателю