• A
  • A
  • A
  • АБB
  • АБB
  • АБB
  • А
  • А
  • А
  • А
  • А
Обычная версия сайта
Магистратура 2025/2026

Инструменты анализа данных

Статус: Курс обязательный (Анализ данных в девелопменте)
Когда читается: 1-й курс, 1, 2 модуль
Охват аудитории: для своего кампуса
Язык: русский
Контактные часы: 56

Программа дисциплины

Аннотация

В результате освоения дисциплины будут изучены современные методы анализа данных для проведения исследований. Студенты овладеют практическими навыками использования возможностей языка Python для работы с данными. Студенты смогут осуществлять предварительную подготовку данных для последующей работы с ними, выбрать подходящий метод анализа в зависимости от типа данных и исследовательской задачи, провести анализ данных и интерпретировать полученные результаты, представить их в доступном для широкой аудитории виде. Целью этого курса является развитие навыков программирования и создание крепкой практической базы для анализа и презентации данных.
Цель освоения дисциплины

Цель освоения дисциплины

  • Формирование у студентов знаний и навыков в области анализа данных с использованием языка Python, формирование умений осуществлять обработку, анализ и интерпретацию данных для решения исследовательских задач с представлением в понятной и наглядной форме.
Планируемые результаты обучения

Планируемые результаты обучения

  • Знать основные конструкции языка Python
  • Знать основы работы с данными: типы данных, структуры, файлы, таблицы
  • Знать методы сбора данных парсинг, API, автоматизация
  • Знать базовые подходы к анализу данных и разведывательному анализу (EDA)
  • Знать инструменты визуализации данных (matplotlib, seaborn)
  • Знать основы работы с текстовыми данными и элементами NLP
  • Уметь использовать Python для решения задач обработки и анализа данных
  • Уметь работать с массивами и таблицами в библиотеках NumPy и Pandas
  • Уметь собирать данные с веб-ресурсов (скрейпинг, API, Selenium)
  • Уметь применять регулярные выражения для обработки текстов
  • Уметь строить визуализации для интерпретации и презентации результатов анализа
  • Уметь создавать простые приложения на Python (в том числе Telegram-ботов с подключением баз данных)
  • Владеть навыками разработки и отладки программного кода на Python
  • Владеть приёмами предобработки данных, их очистки и трансформации
  • Владеть методами анализа данных в зависимости от их типа и поставленной задачи
  • Владеть практикой интеграции данных из разных источников и подготовки итоговой аналитической презентации
  • Владеть опытом командной и проектной работы в сфере анализа данных
Содержание учебной дисциплины

Содержание учебной дисциплины

  • Введение в Python, Jupyter. Ввод-вывод, основные типы данных (int, float, str).
  • Логические переменные, операции и операторы сравнения. Условия if-elif-else. Условный цикл while. Списки, кортежи, последовательности
  • Цикл for. Вложенный цикл for
  • Текстовые файлы и таблицы
  • Классы и основы ООП
  • Телеграм-бот на Python. Работа с SQL и базами данных с помощью Python.
  • Введение в numpy. Работа с векторами и матрицами. Введение в pandas
  • Pandas. Разведывательный анализ данных
  • Сбор данных: requests, BeautifulSoup – продолжение
  • Сбор данных: Selenium, работа с сервисами через API
  • Визуализация в seaborn. EDA особенности
  • Предобработка текстов: лемматизация, удаление стоп-слов
  • Работа с API различных сервисов.
Элементы контроля

Элементы контроля

  • неблокирующий Домашнее задание
    Автоматически проверяемые задания на написание кода и/или задание на обработку данных, сдаваемые преподавателю
  • неблокирующий Проект
    Комплексное задание на проверку навыков парсинга
  • неблокирующий Экзамен
    Автоматически проверяемые задания на написание кода и/или задание на обработку данных, сдаваемые преподавателю
Промежуточная аттестация

Промежуточная аттестация

  • 2025/2026 2nd module
    0.45 * Домашнее задание + 0.25 * Проект + 0.3 * Экзамен
Список литературы

Список литературы

Рекомендуемая основная литература

  • Программирование на PYTHON. Т. 1: ., Лутц, М., 2013

Рекомендуемая дополнительная литература

  • Learning Python : [covers Python 2.5], Lutz, M., 2008
  • Lutz, M. (2009). Learning Python : Powerful Object-Oriented Programming: Vol. 4th ed. O’Reilly Media.

Авторы

  • Емашева Валерия Анатольевна