Магистратура
2025/2026





Семинар наставника "Финансовые технологии и анализ данных"
Статус:
Курс обязательный (Финансовые технологии и анализ данных)
Где читается:
Факультет компьютерных наук
Когда читается:
1-й курс, 1-4 модуль
Охват аудитории:
для своего кампуса
Язык:
русский
Кредиты:
6
Контактные часы:
80
Программа дисциплины
Аннотация
Дисциплина преподается с целью ознакомления слушателей с подходами к решению бизнес-задач в крупных финансовых организациях с применением методов математического моделирования и анализа данных, приобретения навыков постановки прикладных исследовательских задач, проектирования систем машинного обучения, оценки модельных рисков, управления командой ML-специалистов и презентации реализованных решений перед заказчиками.
Основной задачей семинара авторы видят не только изучение различных алгоритмов машинного обучения и подходов к максимизации метрики качества, но и развитие способности критически подходить к выбору этих алгоритмов и метрик для конкретных бизнес задач, а также умения видеть ограничения популярных моделей.
По итогу слушатели научатся выбирать подходящий алгоритм, выявляющий причинно-следственные связи между явлениями (если это необходимо), организовывать команду для решения конкретной задачи и презентовать результаты своей работы.
Цель освоения дисциплины
- Цель освоения дисциплины - анализ научных и практических тенденций в области финансовых технологий
- Формирование у студентов комплекса теоретических знаний и методологических основ в области технологий обработки, хранения, преобразования и визуализации данных. В ходе курса рассматриваются все этапы обработки данных: появление данных в OLTP-системах, их транспорт в OLAP-хранилище, сохранение в сырой слой, нормализация в детальный слой, построение аналитических витрин и отчетов, автоматизация процессов, мониторинг здоровья кластера и системы в целом
- Формирование знаний, умений и навыков проектирования систем машинного обучения, выбора оптимального алгоритма решения поставленной бизнес-задачи и метода оценки его с учётом имеющихся ограничений. Формирование навыков управления командой специалистов с использованием гибких методологий разработки.
Планируемые результаты обучения
- Владение общими навыки проектирования структуры хранилищ данных
- Владение навыками работы с реляционными БД, MPP, DFS-хранилищами
- Умение строить ETL-процессы, осуществлять потоковую и батчевую обработку данных
- Умение строить end-to-end архитектуру хранилища данных, администрировать и поддерживать стабильную работу различных программных комплексов
- Умение строить BI-системы и системы операционного мониторинга
- Формирует задания для исследования новых рынков, следит за ходом исследований и принимает их результаты
- Проводит поиск и анализ наиболее актуальных академических и прикладных исследований в области финансовых технологий
- Понимание основных областей применения Data Science
Содержание учебной дисциплины
- Data Science в приложениях
- Портфельное риск-моделирование
- Ключевые направления исследований в области финансовых технологий
- Постановка исследовательских задач
- Разбор практических кейсов в области финансовых технологий
- Введение в Data Engineering. Устройство современного дата-пайплайна.
- Файловые хранилища. S3-like хранилища. Hadoop-экосистема.
- Устройство и основы работы с Apache Spark.
- Data Warehousing. Современные архитектуры организации хранилищ данных: Data Vault, Anchor Model, hNhM.
- Очереди и работа с потоками данных: Apache Kafka, Spark Streaming
- MPP СУБД: Greenplum, Vertica, Clickhouse. Особенности устройства и организации вычислений
- Планы запросов. Учимся читать планы запросов на реляционных СУБД и MPP
- ETL / ELT. Правила проектирования ETL-процессов
- Использование данных. BI-системы
- Новые вызовы в DE
Элементы контроля
- Домашнее задание 1
- Домашнее задание 2
- Домашнее задание 3
- Домашнее задание 4
- Посещаемость
- Зимний опрос
- Летний опрос
- Итоговый тест
Промежуточная аттестация
- 2025/2026 4th module0.1 * Зимний опрос + 0.3 * Итоговый тест + 0.1 * Летний опрос + 0.5 * Посещаемость
- 2026/2027 3rd module0.25 * Домашнее задание 1 + 0.25 * Домашнее задание 2 + 0.25 * Домашнее задание 3 + 0.25 * Домашнее задание 4
Список литературы
Рекомендуемая основная литература
- Kleppmann, M. (2017). Designing Data-Intensive Applications : The Big Ideas Behind Reliable, Scalable, and Maintainable Systems. Sebastopol, CA: O’Reilly Media. Retrieved from http://search.ebscohost.com/login.aspx?direct=true&site=eds-live&db=edsebk&AN=1487643
- Linstedt, D., & Olschimke, M. (2015). Building a Scalable Data Warehouse with Data Vault 2.0. Amsterdam: Morgan Kaufmann. Retrieved from http://search.ebscohost.com/login.aspx?direct=true&site=eds-live&db=edsebk&AN=1065504
Рекомендуемая дополнительная литература
- DAMA-DMBOK : data management body of knowledge, , 2017
- Kimball, R., & Ross, M. (2013). The Data Warehouse Toolkit : The Definitive Guide to Dimensional Modeling (Vol. 3rd edition). Hoboken, New Jersey: Wiley. Retrieved from http://search.ebscohost.com/login.aspx?direct=true&site=eds-live&db=edsebk&AN=605991
- White, T. (2015). Hadoop: The Definitive Guide : Storage and Analysis at Internet Scale: Vol. 4th edition. O’Reilly Media.