Бакалавриат
2024/2025




Информационный поиск и базы данных
Статус:
Курс по выбору (Фундаментальная и компьютерная лингвистика)
Направление:
45.03.03. Фундаментальная и прикладная лингвистика
Кто читает:
Школа лингвистики
Где читается:
Факультет гуманитарных наук
Когда читается:
4-й курс, 1, 2 модуль
Формат изучения:
без онлайн-курса
Охват аудитории:
для своего кампуса
Язык:
русский
Кредиты:
3
Программа дисциплины
Аннотация
Курс информационного поиска знакомит с современными инструментами машинного обучения и NLP, применяемыми для решения задач полнотекстового поиска. Итогом курса станет разработка самостоятельного IR-проекта.
Цель освоения дисциплины
- знакомство с базовыми понятиями информационного поиска
- постановка задачи информационного поиска
- формирование практических навыков написания поисковых алгоритмов
- углубление знаний о методах автоматической обработки текстов
Планируемые результаты обучения
- доказывает применимость векторного подхода к BM25, может моделировать реализацию
- знает компоненты формулы BM25
- знакомится с постановкой задачи, понимает границы применения
- реализует поисковик с использованием различных векторных моделей, замеряет качество работы
- решает задачу поиска с помощью методов машинного обучения
- умеет работать с индексом в матричной постановке задачи
Содержание учебной дисциплины
- Введение в информационный поиск, булев поиск
- Индексирование, обратный индекс
- Формула Okapi BM25
- Функции ранжирования
- Эмбеддинги - Word2Vec, FastText, BERT, GPT3
- Лабораторная работа: машинное обучение в поиске
Элементы контроля
- дз_бдДомашнее задание по разделу "базы данных"
- проект_бдПроект по разделу "базы данных"
- дз_инфопоиск
- проект_инфопоиск
Промежуточная аттестация
- 2024/2025 2nd module0.25 * дз_бд + 0.25 * дз_инфопоиск + 0.25 * проект_бд + 0.25 * проект_инфопоиск