• A
  • A
  • A
  • АБB
  • АБB
  • АБB
  • А
  • А
  • А
  • А
  • А
Обычная версия сайта
Бакалавриат 2024/2025

Основы SQL и ClickHouse для аналитики данных

Статус: Курс по выбору (Экономика и анализ данных)
Когда читается: 1-й курс, 3 модуль
Охват аудитории: для всех кампусов НИУ ВШЭ
Язык: русский

Программа дисциплины

Аннотация

В современном мире данные играют ключевую роль в принятии обоснованных решений в бизнесе, науке и технологиях. Этот курс предназначен для начинающих аналитиков данных и всех, кто хочет научиться работать с базами данных с помощью SQL и познакомиться с ClickHouse - высокопроизводительной колоночной БД для онлайн-аналитической обработки запросов (OLAP). Курс охватывает основы языка SQL, принципы проектирования и работы с реляционными базами данных, а также особенности работы с ClickHouse для обработки больших объемов данных.
Цель освоения дисциплины

Цель освоения дисциплины

  • Изучение основ SQL -научить студентов базовым операциям с реляционными базами данных: создание запросов, выборка данных, фильтрация, сортировка, группировка и агрегирование.
  • Знакомство с ClickHouse -ознакомить с особенностями ClickHouse как колоночной СУБД, его архитектурой, преимуществами и применением в аналитике больших объемов данных.
  • Практические навыки работы с данными -развить умение работать с реальными данными: загрузка, преобразование, анализ и визуализация результатов.
  • Оптимизация запросов и работа с большими данными -научить оптимизировать SQL-запросы для повышения их производительности, особенно в контексте больших объемов данных, обрабатываемых в ClickHouse.
  • Применение аналитических навыков на практике -подготовить студентов к решению реальных аналитических задач, включая генерацию отчетов, анализ пользовательского поведения и построение метрик на основе данных.
Планируемые результаты обучения

Планируемые результаты обучения

  • Владеет общими понятиями базы данных. Владеет понятием СУБД в прикладных системах. Владеет общими понятиями реляционной модели.
  • понимает и может самостоятельно создавать запросы на языке SQL
  • - создает вложенные запросы - воспроизводит и объясняет структуру запроса с операторами типа JOIN - применяет операторы типа JOIN для слияния данных из нескольких таблиц - применяет обобщенное табличное выражение WITH
  • Умеет применять основные функции для анализа данных в PostgreSQL
  • умеет использовать функции LEAD и LAG для анализа последовательностей данных
  • умеет проводить исследовательский анализ данных с помощью SQL (анализ распределения данных, поиск аномалий)
  • умеет оптимизировать многотабличные запросы
  • умеет оптимизировать запросы в ClickHouse
Содержание учебной дисциплины

Содержание учебной дисциплины

  • Занятие 1. Введение в аналитику. Структура курса. Базы данных и СУБД
  • Занятие 2. Реляционные базы данных и основы SQL
  • Занятие 3. Установка PostgreSQL и работа с инструментом
  • Занятие 4. Применение соединений (JOIN) и агрегатные функции (PostgreSQL)
  • Занятие 5. Оконные функции: простые запросы, накопление, LEAD и LAG (PostgreSQL)
  • Занятие 6. Исследование данных на SQL (PostgreSQL)
  • Занятие 8. Многотабличные запросы (PostgreSQL)
  • Занятие 9. NoSQL-подход: установка ClickHouse и работа с инструментом
  • Занятие 10. Оптимизация запросов в ClickHouse. Применение соединений (JOIN) и агрегатные функции в ClickHouse
  • Занятие 11. Расширенные возможности ClickHouse: Массивы, оконные функции, работа с JSON и GEO в ClickHouse
  • Занятие 12. Итоговый проект: анализ данных с использованием SQL в ClickHouse
Элементы контроля

Элементы контроля

  • неблокирующий Тест 1
  • неблокирующий Тест 2
  • неблокирующий Тест 3
  • неблокирующий Тест 4
  • неблокирующий Тест 5
  • неблокирующий Тест 6
  • неблокирующий Экзамен
Промежуточная аттестация

Промежуточная аттестация

  • 2024/2025 3rd module
    0.1 * Тест 1 + 0.1 * Тест 2 + 0.1 * Тест 3 + 0.1 * Тест 4 + 0.1 * Тест 5 + 0.1 * Тест 6 + 0.4 * Экзамен
Список литературы

Список литературы

Рекомендуемая основная литература

  • Лысенкова, С. Н. «Распределенные базы данных». Основы языка SQL : учебное пособие / С. Н. Лысенкова. — Брянск : Брянский ГАУ, 2022. — 36 с. — Текст : электронный // Лань : электронно-библиотечная система. — URL: https://e.lanbook.com/book/305006 (дата обращения: 00.00.0000). — Режим доступа: для авториз. пользователей.
  • Советов, Б. Я.  Базы данных : учебник для вузов / Б. Я. Советов, В. В. Цехановский, В. Д. Чертовской. — 3-е изд., перераб. и доп. — Москва : Издательство Юрайт, 2024. — 420 с. — (Высшее образование). — ISBN 978-5-534-07217-4. — Текст : электронный // Образовательная платформа Юрайт [сайт]. — URL: https://urait.ru/bcode/535731 (дата обращения: 27.08.2024).

Рекомендуемая дополнительная литература

  • Советов, Б. Я.  Базы данных : учебник для вузов / Б. Я. Советов, В. В. Цехановский, В. Д. Чертовской. — 4-е изд., перераб. и доп. — Москва : Издательство Юрайт, 2024. — 403 с. — (Высшее образование). — ISBN 978-5-534-18479-2. — Текст : электронный // Образовательная платформа Юрайт [сайт]. — URL: https://urait.ru/bcode/535113 (дата обращения: 27.08.2024).

Авторы

  • Колотвина Оксана Альбертовна
  • Егорова Людмила Геннадьевна
  • Титова Наталия Николаевна