Машинное обучение ранжированию (Learning-to-Rank)

kirill_ir · Сообщение **kirill_ir** » 25 май 2026, 21:12

Часть IV · ~10 ч · Сложность: (продвинутый) · Пререквизиты: Модуль 1, 8

Обзор модуля

До сих пор скор документа мы собирали «вручную»: считали BM25, добавляли вес якорей, авторитет ссылочного графа, складывали это линейно с подобранными коэффициентами. Такой подход не масштабируется: факторов (features) становятся сотни и тысячи (Модуль 8), их взаимодействия нелинейны, а «крутить веса руками» — медленно, субъективно и неустойчиво. Обучение ранжированию (learning-to-rank, LTR) заменяет ручную настройку обучаемой моделью: мы собираем размеченные данные «запрос → документы → насколько они релевантны», описываем каждую пару (запрос, документ) вектором факторов и обучаем модель f(x) так, чтобы её порядок выдачи совпадал с эталонным.

В сквозном конвейере «обход → индекс → факторы → ранжирование → выдача → постобработка → измерение» этот модуль — сердце стадии ранжирования. Он стоит ровно между Модулем 8 (где мы научились вычислять и хранить факторы) и Модулем 12 (где модель встраивается в каскад L0–L3 и должна укладываться в бюджет латентности). Обучаемая модель — это и есть «ранжировщик L2», который пересортировывает несколько сотен кандидатов, отобранных дешёвыми уровнями L0–L1.

Ключевая идея, которая отличает LTR от обычной регрессии/классификации: нас интересует относительный порядок, а не абсолютные значения. Пользователю всё равно, выдала ли модель документу скор 0.81 или 8.1 — важно, чтобы релевантный документ стоял выше нерелевантного. Поэтому весь модуль строится вокруг трёх постановок задачи (pointwise, pairwise, listwise), специальных функций потерь и прямой связи с метрикой качества nDCG из Модуля 1 (и офлайн-оценкой из Модуля 19).

После модуля вы сможете: формализовать ранжирование как задачу обучения в трёх постановках и выбрать подходящую; вывести функции потерь RankNet, LambdaRank и ListNet и объяснить, как LambdaRank «подмешивает» nDCG в градиент; понять, почему именно градиентный бустинг деревьев (GBDT/LambdaMART) — рабочая лошадка промышленного LTR; собрать нейросеть поверх факторов, откалибровать её скоры и объединить модели в ансамбль; и критически оценить источники обучающих данных — разметку асессоров против клик-разметки — с учётом их смещений.

Интуиция. LTR — это «не угадать оценку документа, а правильно его поставить в очередь». Метрики качества смотрят на верхушку списка, значит, и учить надо порядок верхушки, а не точное число для каждого документа по отдельности.

Как читать по трекам

Студент CS — обязательно всё. Ядро — главы 9.1 (постановки и loss-функции) и 9.2 (GBDT/LambdaMART). Прорешайте лабу по RankNet/LambdaRank руками: вывод градиента — главный навык модуля.
Инженер поиска/ML — обязательно всё, особенно инженерные заметки про инференс деревьев в рантайме (9.2), калибровку и ансамбли (9.3), а также смещения клик-разметки (9.4) — это определяет, что вы вообще можете обучить.
SEO-специалист — обязательно SEO-врезки и глава 9.4 (что попадает в обучающие данные, как поведение пользователей становится сигналом). Математику loss-функций — обзорно.
Смешанный/руководитель — Обзор, интуиции, заблуждения, итоги. Главное: чем pairwise/listwise лучше pointwise, почему GBDT доминирует и почему клик-данные смещены.

Карта модуля

9.1. Постановки pointwise/pairwise/listwise; функции потерь (RankNet, LambdaRank/LambdaMART, ListNet) (продвинутый)
9.2. Градиентный бустинг деревьев (GBDT) для ранжирования (продвинутый)
9.3. Нейросеть поверх факторов; калибровка скоров; ансамбли и комбинирование (продвинутый)
9.4. Сбор обучающих данных: разметка асессоров vs клик-разметка, смещения (средний)

Глава 9.1. Постановки pointwise/pairwise/listwise; функции потерь (продвинутый)

Цели обучения

После главы студент сможет:

Сформулировать задачу LTR: что такое обучающий пример, метка, группировка по запросу.
Различать три постановки — pointwise, pairwise, listwise — и объяснить их компромиссы.
Вывести функцию потерь RankNet и её градиент через вероятность «i выше j».
Объяснить, как LambdaRank умножает градиент RankNet на |ΔnDCG| и почему это напрямую оптимизирует метрику.
Сравнить ListNet (распределение перестановок / top-1 вероятность) с pairwise-подходом.
Связать функции потерь с метрикой nDCG из Модуля 1.

Конспект

Что такое обучающий пример в LTR

В обычном обучении с учителем пример — это пара (x, y): вектор признаков и метка. В LTR пример устроен иначе, потому что релевантность определена относительно запроса.

Обучающая выборка — это набор групп (query groups). Одна группа = один запрос q и список документов-кандидатов к нему:

Машинное обучение ранжированию (Learning-to-Rank)

Машинное обучение ранжированию (Learning-to-Rank)

Re: Машинное обучение ранжированию (Learning-to-Rank)

Re: Машинное обучение ранжированию (Learning-to-Rank)

Re: Машинное обучение ранжированию (Learning-to-Rank)

Кто сейчас на конференции