Анализ производительности и оптимизация кода

Бакалавриат 2025/2026

Лучший по критерию «Полезность курса для расширения кругозора и разностороннего развития»

Статус: Курс по выбору (Прикладная математика и информатика)

Кто читает: Базовая кафедра Яндекс

Где читается: Факультет компьютерных наук

Когда читается: 3-й курс, 1, 2 модуль

Охват аудитории: для своего кампуса

Преподаватели: Стёпкин Степан Максимович

Язык: русский

Кредиты: 5

Контактные часы: 56

Дополнительные материалы в LMS Задать вопрос

Аннотация

Если вам когда-то было интересно почему __builtin_prefetch не ускоряет ваш код, почему A[2000][2000] сильно быстрее A[2048][2048], то данный курс позволит вам собрать полную картину современного мира оптимизации производительности программ. Начнём с базы, глубоко поговорим про устройство современных CPU, что такое AST деревья и с чем их жарить. И даже будем писать код на выдуманном ассемблере, чтобы пройти симуляцию! Набор трехбуквенных сокращений, с которыми вы ознакомитесь пройдя курс: BTB, LSD, TLB, ILP, OOO, AST, PGO, LTO, ROB, IFB.

Цель освоения дисциплины

Понимание архитектурных особенностей современных процессоров: Изучить устройство CPU (иерархия памяти, конвейеризация, суперскалярность, внеочередное исполнение, спекулятивные вычисления) и понять, как эти особенности влияют на выполнение программ.
Освоение методов анализа производительности: Научиться использовать современные инструменты (профайлеры, симуляторы) для идентификации узких мест (bottlenecks) в программах на различных уровнях: от алгоритмического до аппаратного.
Приобретение навыков низкоуровневой оптимизации: Освоить практические приемы оптимизации кода с учетом особенностей кэш-памяти, предсказания переходов, векторизации и других механизмов процессора.
Изучение возможностей компилятора: Понять принципы работы компиляторов (на примере GCC/Clang), включая этапы генерации промежуточного представления (AST), и научиться использовать его расширенные возможности для оптимизации (PGO, LTO).

Планируемые результаты обучения

Объяснять принципы работы современных CPU (кэш-память, конвейер, предсказание переходов, внеочередное исполнение) и их влияние на performance.
Анализировать код и выявлять узкие места (bottlenecks) с помощью профайлеров (perf, vtune).
Применять низкоуровневые оптимизации: эффективный обход массивов, работа с памятью, использование prefetch и SIMD.
Использовать продвинутые возможности компилятора (PGO, LTO) для автоматической оптимизации.
Оперировать ключевыми концепциями, описываемыми аббревиатурами (TLB, ILP, OOO, ROB, AST и др.).