• A
  • A
  • A
  • АБB
  • АБB
  • АБB
  • А
  • А
  • А
  • А
  • А
Обычная версия сайта
Бакалавриат 2024/2025

Технологии глубокого обучения и больших языковых моделей для задач обработки текстов

Статус: Курс по выбору (Бизнес-информатика)
Когда читается: 4-й курс, 3 модуль
Охват аудитории: для своего кампуса
Язык: русский

Программа дисциплины

Аннотация

В рамках курса студенты изучат технологии обработки тестов на естественном языке, от классических проходов до передовых технологий обработки текста на основе искусственного интеллекта, изучат современные нейросетевые модели, такие как BERT и GPT. Студенты освоят ключевые навыки создания интеллектуальных систем анализа текста, научатся конструировать эффективные промпты, программно использовать, разворачивать и дообучать собственные большие языковые модели и применять их в прикладных бизнес-задачах.
Цель освоения дисциплины

Цель освоения дисциплины

  • В рамках курса студенты должны изучить технологии обработки тестов на естественном языке, от классических проходов до передовых технологий обработки текста на основе искусственного интеллекта, изучат современные нейросетевые модели, такие как BERT и GPT. Студенты освоят ключевые навыки создания интеллектуальных систем анализа текста, научатся конструировать эффективные промпты, программно использовать, разворачивать и дообучать собственные большие языковые модели и применять их в прикладных бизнес-задачах.
Планируемые результаты обучения

Планируемые результаты обучения

  • Применяет основные принципы NLP, векторного представления и языкового моделирования.
  • Применяет принципы глубокого обучения применительно к задачам NLP.
  • Применяет архитектуры рекуррентных нейронных сетей в NLP.
  • Применяет модели на основе BERT в решении задач NLP.
  • Применяет архитектуры построения чат-ботов.
  • Применяет модели из фреймворка Hugging Face.
  • Применяет большие языковые модели для решения бизнес-задач и задач обработки текста.
  • Применяет корректные метрики качества в задачах NLP.
  • Применяет продвинутые практики формирование промптов и цепочек запросов к LLM.
  • Применяет продвинутые методы работы с LLM.
Содержание учебной дисциплины

Содержание учебной дисциплины

  • Введение в NLP: языковое моделирование, tf-idf
  • Введение в глубокое обучение в NLP, word2vec
  • Рекуррентные нейронные сети
  • Механизм внимания, трансформеры, BERT
  • Чат-боты, обучение с подкреплением
  • Инфраструктура Hugging face и NLP модели
  • Большие языковые модели (LLM)
  • Метрики качества в NLP
  • Подготовка промптов, langchain, RAG
  • Продвинутые техники работы с LLM
Элементы контроля

Элементы контроля

  • неблокирующий Групповой проект
    В мини-группах решаются проектные задания на создание программных решений задач для NLP
  • блокирующий Экзамен
  • неблокирующий Активность на семинарах
Промежуточная аттестация

Промежуточная аттестация

  • 2024/2025 3rd module
    0.1 * Активность на семинарах + 0.4 * Групповой проект + 0.5 * Экзамен
Список литературы

Список литературы

Рекомендуемая основная литература

  • 9781800206571 - Serg Masís - Interpretable Machine Learning with Python : Learn to Build Interpretable High-performance Models with Hands-on Real-world Examples - 2021 - Packt Publishing - https://search.ebscohost.com/login.aspx?direct=true&db=nlebk&AN=2901980 - nlebk - 2901980
  • 9781838827724 - Antonio Gulli; Amita Kapoor; Sujit Pal - Deep Learning with TensorFlow 2 and Keras : Regression, ConvNets, GANs, RNNs, NLP, and More with TensorFlow 2 and the Keras API, 2nd Edition - 2019 - Packt Publishing - http://search.ebscohost.com/login.aspx?direct=true&db=nlebk&AN=2339879 - nlebk - 2339879
  • 9781839216077 - Artasanchez, Alberto; Joshi, Prateek - Artificial Intelligence with Python : Your Complete Guide to Building Intelligent Apps Using Python 3.x and TensorFlow 2, 2nd Edition - 2020 - Packt Publishing - http://search.ebscohost.com/login.aspx?direct=true&db=nlebk&AN=2366457 - nlebk - 2366457
  • Alblawi, A. S. (2018). Big Data and Learning Analytics in Higher Education: Demystifying Variety, Acquisition, Storage, NLP and Analytics.
  • Aman Kedia, & Mayank Rasu. (2020). Hands-On Python Natural Language Processing : Explore Tools and Techniques to Analyze and Process Text with a View to Building Real-world NLP Applications. Packt Publishing.
  • Data Science в действии : пять реальных проектов Python, Апельцин, Л., 2023
  • Deep learning : how the mind overrides experience, Ohlsson, S., 2011
  • Deep learning, Goodfellow, I., 2016
  • Explainable AI recipes : implement solutions to model explainability and interpretability with Python, Mishra, P., 2023
  • Hellmann, S. (2015). Integrating Natural Language Processing (NLP) and Language Resources Using Linked Data.
  • Integrating deep learning algorithms to overcome challenges in big data analytics, , 2022
  • Pandas for everyone : Python data analysis, Chen, D. Y., 2023
  • Productionizing AI : how to deliver AI B2B solutions with cloud and Python, Walsh, B., 2023
  • Python 3, Прохоренок, Н. А., 2016
  • Python 3. Самое необходимое — 2-е изд., перераб. и доп. - 978-5-9775-3994-4 - Прохоренок Н. А., Дронов В. А. - 2018 - Санкт-Петербург: БХВ-Петербург - https://ibooks.ru/bookshelf/386515 - 386515 - iBOOKS
  • Python crash course : a hands-on, project-based introduction to programming, Matthes, E., 2023
  • Python для сложных задач: наука о данных и машинное обучение : пер. с англ., Плас, Дж. Вандер, 2019
  • Python для финансистов. - 978-5-4461-2250-9 - Хилпиш Ив - 2023 - Санкт-Петербург: Питер - https://ibooks.ru/bookshelf/390132 - 390132 - iBOOKS
  • Python. Исчерпывающее руководство. - 978-5-4461-1956-1 - Бизли Дэвид - 2023 - Санкт-Петербург: Питер - https://ibooks.ru/bookshelf/386795 - 386795 - iBOOKS
  • The Little Learner: чудесное машинное обучение, Фридман, Д. П., 2024
  • Time series algorithms recipes : implement machine learning and deep learning techniques with Python, , 2023
  • Uday Kamath, John Liu, & James Whitaker. (2019). Deep Learning for NLP and Speech Recognition. Springer.
  • Yu, H. Q. (2019). Mining symptom and disease web data with NLP and Open Linked Data. https://doi.org/10.11159/mvml19.108
  • Анализ данных : учебник для вузов, , 2024
  • Вероятностное машинное обучение : введение, Мэрфи, К. П., 2023
  • Искусственный интеллект на службе бизнеса : как машинное прогнозирование помогает принимать решения, Агравал, А., 2019
  • Как Alibaba использует искусственный интеллект в бизнесе, Сетевое взаимодействие и анализ данных, пер. с кит. Кирилл Батыгин, 359 с., Цзэн, М., 2022
  • Машинное обучение : наука и искусство построения алгоритмов, которые извлекают знания из данных, Флах, П., 2015
  • Машинное обучение : портфолио реальных проектов, Григорьев, А., 2023
  • Машинное обучение в финансах : учебник для магистратуры, , 2024
  • Машинное обучение для абсолютных новичков : вводный курс, изложенный простым языком, Теобальд, О., 2024

Рекомендуемая дополнительная литература

  • Derivatives analytics with Python : data analysis, models, simulation, calibration and hedging, Hilpisch, Y. J., 2015
  • Pro Deep Learning with TensorFlow 2.0 : a mathematical approach to advanced artificial intelligence in Python, Pattanayak, S., 2023
  • Python : исчерпывающее руководство, Бизли, Д. М., 2023
  • Python distilled, Beazley, D. M., 2022
  • Python для data science, Васильев, Ю., 2023
  • Машинное обучение без лишних слов, Бурков, А., 2020

Авторы

  • Макрушин Сергей Вячеславович