Магистратура
2024/2025





Машинное обучение
Статус:
Курс обязательный (Магистр по наукам о данных)
Когда читается:
1-й курс, 3, 4 модуль
Охват аудитории:
для своего кампуса
Преподаватели:
Саночкин Юрий Ильич
Язык:
русский
Программа дисциплины
Аннотация
Курс "Машинное обучение" предоставляет фундаментальные знания и практические навыки в области искусственного интеллекта и анализа данных. Он охватывает основные методы и алгоритмы, используемые для построения моделей, способных обучаться на основе данных и принимать решения.
Цель освоения дисциплины
- Ознакомить студентов с ключевыми концепциями и техниками машинного обучения.
- Развить умения выбора и применения наиболее подходящих алгоритмов для решения конкретных задач.
- Научить анализировать, обрабатывать и интерпретировать большие объемы данных.
- Развить навыки оценки и улучшения качества моделей машинного обучения.
Планируемые результаты обучения
- Выбирает и применяет подходящие алгоритмы машинного обучения для различных типов задач
- Проводит предобработку и анализ данных, включая очистку, нормализацию и обработку пропущенных значений.
- Разрабатывает, обучает и оценивает модели классификации и регрессии.
- Применяет методы кластеризации на практике для группировки данных.
- Оценивает качество моделей с использованием различных метрик и методов перекрестной проверки.
- Владеет инструментами и фреймворками для машинного обучения, такими как scikit-learn и другие.
- Учитывает этические аспекты использования машинного обучения при разработке моделей.
- Интегрирует модели машинного обучения в реальные бизнес-процессы и решает практические задачи в различных областях.
Содержание учебной дисциплины
- Библиотека Numpy
- Библиотека Numpy 2
- Библиотека Pandas
- Библиотека Pandas 2
- Pandas для продвинутых задач анализа данных
- Pandas для продвинутых задач анализа данных 2
- Введение в машинное обучение
- Введение в машинное обучение 2
- Введение в машинное обучение. Практический кейс.
- Математика для анализа данных. Линейная алгебра.
- Практикум по линейной алгебре
- Математика для анализа данных. Математический анализ.
- Практикум по математическому анализу
- Задача классификации. KNN.
- Задача классификации. KNN. 2
- Задача регрессии. KNN и линейная регрессия.
- Задача регрессии. KNN и линейная регрессия. 2
- Решающие деревья
- Решающие деревья 2
- Композиции над деревьями. Случайный лес.
- Композиции над деревьями. Случайный лес. 2
- Композиции над деревьями. Градиентный бустинг.
- Композиции над деревьями. Градиентный бустинг. 2
- Задача кластеризации
- Задача кластеризации 2
Элементы контроля
- Домашние задания (HW)
- Групповой проект (GP)
- Экзамен (EX)
- Активность на лекциях и семинарах (ACT)
Промежуточная аттестация
- 2024/2025 4th moduleMin (0,3 HW + 0,3 GP + 0.4 EX + 0.2 ACT; 10), где Min - математическая функция минимума
Список литературы
Рекомендуемая основная литература
- Grus, J. (2019). Data Science From Scratch : First Principles with Python (Vol. Second edition). Sebastopol, CA: O’Reilly Media. Retrieved from http://search.ebscohost.com/login.aspx?direct=true&site=eds-live&db=edsebk&AN=2102311
- Machine learning : a probabilistic perspective, Murphy, K. P., 2012
- Pattern recognition and machine learning, Bishop, C. M., 2006
- Машинное обучение. - 978-5-496-02989-6 - Бринк Хенрик, Ричардс Джозеф, Феверолф Марк - 2018 - Санкт-Петербург: Питер - https://ibooks.ru/bookshelf/355472 - 355472 - iBOOKS
Рекомендуемая дополнительная литература
- Murphy, K. P. (2012). Machine Learning : A Probabilistic Perspective. Cambridge, Mass: The MIT Press. Retrieved from http://search.ebscohost.com/login.aspx?direct=true&site=eds-live&db=edsebk&AN=480968