2024/2025





Веб-поиск и ранжирование
Статус:
Маго-лего
Когда читается:
3 модуль
Охват аудитории:
для всех кампусов НИУ ВШЭ
Преподаватели:
Стоян Андрей Сергеевич
Язык:
русский
Кредиты:
3
Программа дисциплины
Аннотация
Дисциплина направлена на формирование у студентов теоретических знаний и практических навыков веб-поиска и ранжирования данных. Студенты получат знания об основных алгоритмах веб-поиска, создадут собственный веб-краулер и проведут оценку качества собранных результатов. Для освоения дисциплины студентам необходимы знания, полученные в результате изучения дисциплин «Машинное обучение», «Теория вероятностей и математическая статистика».
Цель освоения дисциплины
- Формирование у студентов теоретических знаний и практических навыков веб-поиска и ранжирования данных.
Планируемые результаты обучения
- Знает технологии оценки качества поиска
- Умеет собирать данные из веб-ресурсов
- Имеет навыки использования прямых методов ранжирования и способов проведения ранжирования с использованием машинного обучения.
Содержание учебной дисциплины
- Раздел 1. Оценка качества информационного поиска
- Раздел 2. Подготовка данных для поиска, обработка запроса
- Раздел 3. Классические подходы к ранжированию, применение семантических методов и машинного обучения
- Раздел 4. Федеративный поиск, кликовые модели
Элементы контроля
- Course project №2As a course project, students will be required to implement a project that uses modern web search and ranking methods to solve applied task. Project completion time is 5 weeks.
- ExamThe oral exam is carried out in the form of answers to the questions of the exam ticket. The exam ticket contains two questions from the list of questions for the exam. 2.5 hours are given to prepare the answer.
- Course project №1As a course project, students will be required to implement a project that uses modern web search and ranking methods to solve applied task. Project completion time is 5 weeks.
Промежуточная аттестация
- 2024/2025 3rd module0.3 * Course project №1 + 0.3 * Course project №2 + 0.4 * Exam
Список литературы
Рекомендуемая основная литература
- Gossen, T. (2015). Search Engines for Children : Search User Interfaces and Information-Seeking Behaviour. Wiesbaden: Springer Vieweg. Retrieved from http://search.ebscohost.com/login.aspx?direct=true&site=eds-live&db=edsebk&AN=1159664
- Sándor Dominich. The Modern Algebra of Information Retrieval (2008), Springer
Рекомендуемая дополнительная литература
- Hwee Tou Ng, Mun-Kew Leong, Min-Yen Kan, Donghong Ji. Information Retrieval Technology/Third Asia Information Retrieval Symposium, AIRS 2006, Singapore, October 16-18, 2006. Proceedings, 2006, Springer
- Levene, M. (2010). An Introduction to Search Engines and Web Navigation. Hoboken, N.J.: Wiley. Retrieved from http://search.ebscohost.com/login.aspx?direct=true&site=eds-live&db=edsebk&AN=335281