2025/2026


LSML
Статус:
Маго-лего
Где читается:
Факультет компьютерных наук
Когда читается:
3 модуль
Охват аудитории:
для своего кампуса
Преподаватели:
Галушкин Андрей Владимирович
Язык:
английский
Кредиты:
3
Контактные часы:
24
Course Syllabus
Abstract
The discipline introduces students to the main tasks of machine learning on big data, their features and limitations. To master the academic discipline, students must have knowledge and competencies in the following disciplines: Mathematical analysis Linear Algebra and geometry Probability theory Mathematical statistics Algorithms and data structures Machine learning
Learning Objectives
- Introducing students to the main tasks of machine learning on big data, their features, and limitations
Course Contents
- Hadoop
- Spark
- Linear models
- Boosting
- Recommender systems
- Neural networks
- Hashing tricks
- Min hash & LSH
- Spark streaming and Kafka
- Catboost
Assessment Elements
- Мини-домашнее задание 2Алгоритм на Map Reduce Алгоритмы на Spark
- Большое домашнее заданиеОбучить модель на большом датасете
- Мини-домашнее задание 3Более продвинутые задачи по работе на Spark Собрать признаки из имеющихся данных
- Мини-домашнее задание 4Собрать датасет на Spark Обучить классическую модель
- Мини-домашнее задание 1Работа с облаком Алгоритм на Bash
- Опциональный экзамен