Бакалавриат
2024/2025![Цель освоения дисциплины](/f/src/global/i/edu/objectives.svg)
![Планируемые результаты обучения](/f/src/global/i/edu/results.svg)
![Содержание учебной дисциплины](/f/src/global/i/edu/sections.svg)
![Элементы контроля](/f/src/global/i/edu/controls.svg)
![Промежуточная аттестация](/f/src/global/i/edu/intermediate_certification.svg)
Продвинутые методы анализа и визуализации данных в Python
Статус:
Курс по выбору (Политология)
Направление:
41.03.04. Политология
Где читается:
Факультет социальных наук
Когда читается:
3-й курс, 3, 4 модуль
Формат изучения:
с онлайн-курсом
Онлайн-часы:
50
Охват аудитории:
для всех кампусов НИУ ВШЭ
Преподаватели:
Бурова Маргарита Борисовна
Язык:
русский
Кредиты:
4
Программа дисциплины
Аннотация
Данный курс представляет собой адаптацию общеуниверситетского курса по анализу данных и направлен на формирование компетенций в области статистики и анализа данных. В курсе будут рассмотрены темы, которые необходимы для успешного освоения основных понятий и методов, связанных с анализом данных. Также будут рассмотрены темы, связанные с основами машинного обучения. Дисциплина реализуется с помощью онлайн-курса «Учебник по Анализу данных (Базовый)» в SmartLMS (https://edu.hse.ru/course/view.php?id=136232).
Цель освоения дисциплины
- Целью освоения дисциплины «Анализ данных» является овладение студентами основами статистики и анализа данных для применения в решении различных практических задач.
Планируемые результаты обучения
- Использовать Python в применении к анализу данных.
- Корректно открывать табличные данные различных форматов.
- Фильтровать данные по нескольким условиям.
- Сортировать данные.
- Использовать собственноручно написанные функции для обработки данных, создания новых переменных.
- Создавать сводные таблицы.
- Вычислять описательные статистики и интерпретировать полученные результаты.
- Переводить значения признака в z-оценки.
- Обрабатывать пропущенные значения и выбросы.
- Вычислять релевантные описательные статистики и интерпретировать полученные результаты.
- Вычислять коэффициент корреляции Пирсона и интерпретировать полученные результаты.
- Визуализировать данные с помощью простейших видов диаграмм: линейной, точечной, столбчатой.
- Понимать и корректно использовать основные статистические понятия.
- Визуализировать данные с помощью различных диаграмм: тепловой карты, ящика с усами и других.
- Создавать интерактивные визуализации.
- Реализовывать разведочный анализ данных.
- Уметь реализовывать все шаги проверки статистических гипотез.
- Применять параметрические статистические критерии для проверки гипотез.
- Применять непараметрические статистические критерии для проверки гипотез.
- Построить уравнение линейной регрессии с использованием метода наименьших квадратов.
- Оценивать качество модели линейной регрессии с помощью релевантных метрик.
- Решать задачу классификации с использованием логистической регрессии и KNN.
- Оценивать качество модели классификации с помощью релевантных метрик.
Содержание учебной дисциплины
- Введение в инструменты.
- Введение в статистику. Базовые манипуляции с данными.
- Типы данных. Создание новых переменных.
- Генеральная совокупность и выборка. Частотные таблицы и распределения.
- Описательные статистики: меры центральной тенденции и разброса.
- Z-оценка. Выбросы.
- Корреляция.
- Введение в визуализацию данных.
- Продвинутая визуализация данных.
- Введение в тестирование гипотез. Непараметрические критерии.
- Параметрические критерии для проверки гипотез.
- Линейная регрессия.
- Логистическая регрессия.
- Введение в машинное обучение.
Элементы контроля
- Домашнее заданиеДомашнее задание: решение задачи машинного обучения
- Самостоятельные работы
- Работы на семинарах
- Контрольная работа
- Проект
Промежуточная аттестация
- 2024/2025 4th module0.25 * Домашнее задание + 0.2 * Контрольная работа + 0.25 * Проект + 0.15 * Работы на семинарах + 0.15 * Самостоятельные работы