• A
  • A
  • A
  • АБB
  • АБB
  • АБB
  • А
  • А
  • А
  • А
  • А
Обычная версия сайта
Бакалавриат 2025/2026

Анализ данных в Python

Когда читается: 2-й курс, 1, 2 модуль
Онлайн-часы: 20
Охват аудитории: для своего кампуса
Язык: русский

Программа дисциплины

Аннотация

Язык программирования Python широко используется в анализе данных о социальных, экономических, политических и иных процессах. Владение этим инструментом будет полезным как для студентов, готовящихся как к карьере в академической карьере, так и к работе на государственной службе или в бизнесе. В рамках этого курса студенты научатся использовать специализированные библиотеки языка Python для обработки и визуализации данных, проверки статистических гипотез, проведения регрессионного анализа и визуализации его результатов. После прохождения этого курса студенты смогут самостоятельно и профессионально проводить анализ данных по разнообразным проблемам, что повысит их ценность как специалистов и в науке, и на государственной службе, и в бизнесе.
Цель освоения дисциплины

Цель освоения дисциплины

  • Цели освоения этой учебной дисциплины: 1) овладение навыками использования языка программирования Python для анализа данных; 2) формирование способности корректно реализовывать количественные методы научных и аналитических исследований на языке Python
Планируемые результаты обучения

Планируемые результаты обучения

  • Формулировать содержание и функции конкретных количественных методов социальных исследований.
  • Интерпретировать результаты, полученные в ходе анализа данных с помощью количественных методов исследований, с точки зрения формальных статистических критериев.
  • Применять необходимые наборы библиотек и команд на языке программирования Python для обработки и анализа данных.
Содержание учебной дисциплины

Содержание учебной дисциплины

  • Введение в обработку данных
  • Непараметрические коэффициенты корреляции
  • Тестирование статистических гипотез в Python
  • Визуализация данных в Python
  • Решение задачи регрессии в Python: интервальные зависимые переменные
  • Решение задачи классификации с помощью логистической регрессии
Элементы контроля

Элементы контроля

  • неблокирующий Решение задач в ходе семинаров
    Перед каждым занятием (кроме первого и кроме занятия, посвящённого контрольной работе) студентам будет дано задание изучить в целях подготовки к семинару видеоматериалы онлайн-курса "Статистика для анализа данных" по заданной теме/темам. В ходе семинара студентам будет предложено решить практические задания из тестов из онлайн-курса "Статистика для анализа данных". Для решения каждого практического задания будет вызываться один студент (по собственной инициативе или по решению преподавателя). Студент должен самостоятельно, под наблюдением преподавателя и коллег по группе, решить задание, а затем объяснить ход решения. В случае успешного решения практического задания студент получит 10% итоговой оценки за курс в целом (но не более 30% итоговой оценки за курс в целом в сумме по данному элементу контроля). Таким образом, от каждого студента ожидается решение (в аудитории на семинаре под контролем преподавателя) трёх заданий в течение курса для получения максимальной оценки по данному элементу контроля.. При решении задач запрещается использовать генеративные модели искусственного интеллекта, а также запрещается использовать подсказки и иную помощь от других лиц, за исключением преподавателя. Студентам запрещено подсказывать или предоставлять иную помощь в решении заданий другим студентам. Под практическими заданиями понимаются задания, для решения которых необходимо использовать специализированные программы для анализа данных или языки программирования. Задания должны быть решены на языке Python.
  • блокирующий Экзамен
    Правила проведения экзамена 1) Длительность - 1 час 10 мин с момента отправки данных преподавателем. 2) По итогам экзамена нужно отправить преподавателю ответы и программный код с решением установленным преподавателем способом. Отсутствие кода или неправильное решение/ответ в файле с кодом - основание для снижения оценки даже при правильных ответах. 3) В ходе экзамена разрешается пользоваться своим листом бумаги формата A4, на котором может быть заранее (до экзамена) записана информация, касающаяся статистических методов анализа данных и/или языка Python, в том числе примеры команд и библиотек; 4) Экзамен следует выполнять на установленных в аудитории компьютерах, принадлежащих НИУ ВШЭ. Использование иных компьютеров при решении заданий экзамена допускается в исключительных случаях (технические проблемы на университетских компьютерах, отсутствие свободных университетских компьютеров) с предварительного согласия преподавателя, данного индивидуально каждому желающему использовать иное устройство студенту. 5) На экзамене запрещается: - пользоваться помощью других людей, включая коллег по курсу; - оказывать помощь коллегам по курсу в решении заданий; - переговариваться и переписываться с коллегами по курсу, в том числе помогать в осуществлении переговоров и переписки; - пользоваться генеративным искусственным интеллектом (Chat GPT и его аналоги); - пользоваться социальными сетями и мессенджерами; - пользоваться смартфонами и другими электронно-вычислительными машинами (ЭВМ), кроме компьютера, используемого для выполнения заданий; - пользоваться Интернетом (за исключением страниц и сайтов, специально указанных преподавателем перед началом экзамена), открытие других страниц и сайтов может допускаться с предварительного индивидуального разрешения преподавателя. 6) Перемещения по аудитории и выход из аудитории без согласия преподавателя запрещены, за исключением ситуаций, связанных с непосредственной угрозой жизни и здоровью. При временном выходе из аудитории без окончательной сдачи работы все электронные технические средства (ЭВМ и средства связи) должны быть оставлены в аудитории. В одно и то же время временно отсутствовать в аудитории может только один студент. 6) За нарушение правил следует удаление из аудитории с проставлением нулевой оценки за экзамен. 7) Экзамен проводится очно. Дополнительные правила могут быть изложены в специальных формах на странице курса в Smart LMS или в рамках рассылки по корпоративной электронной почте.
  • неблокирующий Контрольная работа
    Правила проведения контрольной работы 1) Длительность - 1 час 10 мин с момента отправки данных преподавателем. 2) По итогам контрольной работы нужно отправить преподавателю ответы и программный код с решением установленным преподавателем способом. Отсутствие кода или неправильное решение/ответ в файле с кодом - основание для снижения оценки даже при правильных ответах. 3) В ходе контрольной работы разрешается пользоваться своим листом бумаги формата A4, на котором может быть заранее (до экзамена) записана информация, касающаяся статистических методов анализа данных и/или языка Python, в том числе примеры команд и библиотек; 4) Контрольную работу следует выполнять на установленных в аудитории компьютерах, принадлежащих НИУ ВШЭ. Использование иных компьютеров при решении заданий экзамена допускается в исключительных случаях (технические проблемы на университетских компьютерах, отсутствие свободных университетских компьютеров) с предварительного согласия преподавателя, данного индивидуально каждому желающему использовать иное устройство студенту. 5) На контрольной работе запрещается: - пользоваться помощью других людей, включая коллег по курсу; - оказывать помощь коллегам по курсу в решении заданий; - переговариваться и переписываться с коллегами по курсу, в том числе помогать в осуществлении переговоров и переписки; - пользоваться генеративным искусственным интеллектом (Chat GPT и его аналоги); - пользоваться социальными сетями и мессенджерами; - пользоваться смартфонами и другими электронно-вычислительными машинами (ЭВМ), кроме компьютера, используемого для выполнения заданий; - пользоваться Интернетом (за исключением страниц и сайтов, специально указанных преподавателем перед началом экзамена), открытие других страниц и сайтов может допускаться с предварительного индивидуального разрешения преподавателя в целях обеспечения технического доступа к заданиям. 6) Перемещения по аудитории и выход из аудитории без согласия преподавателя запрещены, за исключением ситуаций, связанных с непосредственной угрозой жизни и здоровью. При временном выходе из аудитории без окончательной сдачи работы все электронные технические средства (ЭВМ и средства связи) должны быть оставлены в аудитории. В одно и то же время временно отсутствовать в аудитории может только один студент. 6) За нарушение правил следует удаление из аудитории с проставлением нулевой оценки за экзамен. 7) Контрольная работа проводится очно. Дополнительные правила могут быть изложены в специальных формах на странице курса в Smart LMS или в рамках рассылки по корпоративной электронной почте.
Промежуточная аттестация

Промежуточная аттестация

  • 2025/2026 2nd module
    0.35 * Контрольная работа + 0.3 * Решение задач в ходе семинаров + 0.35 * Экзамен
Список литературы

Список литературы

Рекомендуемая основная литература

  • Python for data analysis : data wrangling with pandas, numPy, and IPhython, Mckinney, W., 2017

Рекомендуемая дополнительная литература

  • Python для сложных задач : наука о данных и машинное обучение, Плас, Дж. В., 2018

Авторы

  • Беленков Вадим Евгеньевич