Бакалавриат
2024/2025




Основы SQL и ClickHouse для аналитики данных
Статус:
Курс по выбору (Экономика и анализ данных)
Кто читает:
Департамент математики
Когда читается:
1-й курс, 3 модуль
Охват аудитории:
для всех кампусов НИУ ВШЭ
Преподаватели:
Титова Наталия Николаевна
Язык:
русский
Программа дисциплины
Аннотация
В современном мире данные играют ключевую роль в принятии обоснованных решений в бизнесе, науке и технологиях. Этот курс предназначен для начинающих аналитиков данных и всех, кто хочет научиться работать с базами данных с помощью SQL и познакомиться с ClickHouse - высокопроизводительной колоночной БД для онлайн-аналитической обработки запросов (OLAP). Курс охватывает основы языка SQL, принципы проектирования и работы с реляционными базами данных, а также особенности работы с ClickHouse для обработки больших объемов данных.
Цель освоения дисциплины
- Изучение основ SQL -научить студентов базовым операциям с реляционными базами данных: создание запросов, выборка данных, фильтрация, сортировка, группировка и агрегирование.
- Знакомство с ClickHouse -ознакомить с особенностями ClickHouse как колоночной СУБД, его архитектурой, преимуществами и применением в аналитике больших объемов данных.
- Практические навыки работы с данными -развить умение работать с реальными данными: загрузка, преобразование, анализ и визуализация результатов.
- Оптимизация запросов и работа с большими данными -научить оптимизировать SQL-запросы для повышения их производительности, особенно в контексте больших объемов данных, обрабатываемых в ClickHouse.
- Применение аналитических навыков на практике -подготовить студентов к решению реальных аналитических задач, включая генерацию отчетов, анализ пользовательского поведения и построение метрик на основе данных.
Планируемые результаты обучения
- Владеет общими понятиями базы данных. Владеет понятием СУБД в прикладных системах. Владеет общими понятиями реляционной модели.
- понимает и может самостоятельно создавать запросы на языке SQL
- - создает вложенные запросы - воспроизводит и объясняет структуру запроса с операторами типа JOIN - применяет операторы типа JOIN для слияния данных из нескольких таблиц - применяет обобщенное табличное выражение WITH
- Умеет применять основные функции для анализа данных в PostgreSQL
- умеет использовать функции LEAD и LAG для анализа последовательностей данных
- умеет проводить исследовательский анализ данных с помощью SQL (анализ распределения данных, поиск аномалий)
- умеет оптимизировать многотабличные запросы
- умеет оптимизировать запросы в ClickHouse
Содержание учебной дисциплины
- Занятие 1. Введение в аналитику. Структура курса. Базы данных и СУБД
- Занятие 2. Реляционные базы данных и основы SQL
- Занятие 3. Установка PostgreSQL и работа с инструментом
- Занятие 4. Применение соединений (JOIN) и агрегатные функции (PostgreSQL)
- Занятие 5. Оконные функции: простые запросы, накопление, LEAD и LAG (PostgreSQL)
- Занятие 6. Исследование данных на SQL (PostgreSQL)
- Занятие 8. Многотабличные запросы (PostgreSQL)
- Занятие 9. NoSQL-подход: установка ClickHouse и работа с инструментом
- Занятие 10. Оптимизация запросов в ClickHouse. Применение соединений (JOIN) и агрегатные функции в ClickHouse
- Занятие 11. Расширенные возможности ClickHouse: Массивы, оконные функции, работа с JSON и GEO в ClickHouse
- Занятие 12. Итоговый проект: анализ данных с использованием SQL в ClickHouse
Промежуточная аттестация
- 2024/2025 3rd module0.1 * Тест 1 + 0.1 * Тест 2 + 0.1 * Тест 3 + 0.1 * Тест 4 + 0.1 * Тест 5 + 0.1 * Тест 6 + 0.4 * Экзамен
Список литературы
Рекомендуемая основная литература
- Лысенкова, С. Н. «Распределенные базы данных». Основы языка SQL : учебное пособие / С. Н. Лысенкова. — Брянск : Брянский ГАУ, 2022. — 36 с. — Текст : электронный // Лань : электронно-библиотечная система. — URL: https://e.lanbook.com/book/305006 (дата обращения: 00.00.0000). — Режим доступа: для авториз. пользователей.
- Советов, Б. Я. Базы данных : учебник для вузов / Б. Я. Советов, В. В. Цехановский, В. Д. Чертовской. — 3-е изд., перераб. и доп. — Москва : Издательство Юрайт, 2024. — 420 с. — (Высшее образование). — ISBN 978-5-534-07217-4. — Текст : электронный // Образовательная платформа Юрайт [сайт]. — URL: https://urait.ru/bcode/535731 (дата обращения: 27.08.2024).
Рекомендуемая дополнительная литература
- Советов, Б. Я. Базы данных : учебник для вузов / Б. Я. Советов, В. В. Цехановский, В. Д. Чертовской. — 4-е изд., перераб. и доп. — Москва : Издательство Юрайт, 2024. — 403 с. — (Высшее образование). — ISBN 978-5-534-18479-2. — Текст : электронный // Образовательная платформа Юрайт [сайт]. — URL: https://urait.ru/bcode/535113 (дата обращения: 27.08.2024).