Если выстраивать факторы из утечки метаданных web_production (1923 фактора) по реальному вкладу в позицию, поведенческая группа стоит на вершине. Текст и ссылки задают, может ли документ в принципе релевантно ответить на запрос. Поведение отвечает на другой вопрос: а доволен ли пользователь тем, что получил. Именно второй вопрос Яндекс решает в последнюю очередь и с наибольшим весом, потому что это единственный сигнал, который меряет результат, а не намерение.
Группа B измеряет, что человек делает с выдачей: остался на странице и читал (хорошо) или вернулся обратно в поисковую выдачу за следующим результатом (плохо), сколько времени провёл, и - что критично - как это выглядит на мобильных устройствах.
Сводная формула группы
Код: Выделить всё
B = wlc*LongClickProb - wls*LossesProb + wdt*DwellTime + wctr*SnippetCTR + wgeo*GeoClicks
Конкретные факторы и их индексыДисклеймер: веса (wlc, wls, wdt, wctr, wgeo) здесь иллюстративны. Реальные коэффициенты обучаемы, проприетарны и нелинейны - это не сумма с фиксированными множителями, а вход в обученную формулу. Всё ниже - реконструкция логики по именам факторов из метаданных, а не воспроизведение боевого ранжирования.
Код: Выделить всё
LongClickProb
[588] USLongPeriodUrlMobileLongClickProb
вероятность "долгого клика" - пользователь
кликнул и остался. Мобайл, длинное окно
наблюдений (порядка 1600 дней).
LossesProb
[589] USLongPeriodUrlMobileLossesProb
вероятность "потери" - пользователь отскочил
назад в выдачу. Это ПРЯМОЙ ШТРАФ.
DwellTime
[587] USLongPeriodUrlMobileDt180Avg
среднее время на странице, порог 180 секунд.
[590] USLongPeriodUrlMobileDt3600AvgReg
то же, но порог 3600 секунд, с региональной
привязкой.
[847] BrowserHostCntDwellTimeLog
логарифм среднего времени на хосте по данным
Яндекс.Браузера.
[849] BrowserUrlDwellTimeRegionFrc
доля: время на странице в регионе пользователя
к времени по всем регионам.
[1192] QueryDwellTimeBclmWeightedProximity
текстовая близость (BCLM/proximity), ВЗВЕШЕННАЯ
по dwell-time. Текст, помноженный на поведение.
SnippetCTR
группа QueryTitleSnippetCTR
кликабельность пары "запрос - сниппет" в выдаче.
GeoClicks
[838-840] URLClicksMaxGeoCityFRC*
клики с учётом города пользователя.
Вся группа держится на одной паре противоположностей.
Долгий клик (long-click). Фактор [588] оценивает вероятность того, что после перехода из выдачи пользователь не вернулся быстро, а провёл на странице содержательное время. Это сигнал удовлетворённости: страница закрыла запрос, искать дальше не пришлось. Долгий клик - это положительный голос за документ.
Потеря (loss). Фактор [589] - зеркальный. Это вероятность того, что пользователь отскочил обратно в выдачу, чтобы выбрать другой результат. На уровне здравого смысла это "обманул ожидание": сниппет пообещал ответ, страница не дала. Важно, что losses вынесен в отдельный фактор и работает как прямой штраф, а не просто как отсутствие награды. Документ может набирать долгие клики от одной аудитории и одновременно копить потери от другой - и штраф будет учтён явно.
Dwell-time: время как мера качестваФормула группы по сути сводится к одной мысли: B приблизительно равно (остался и читал) минус (отскочил). Награда за удержание и штраф за возврат - две независимые величины, а не один знакопеременный сигнал.
Dwell-time - это время между кликом по результату и возвратом в выдачу. Группа B меряет его сразу несколькими способами, и набор порогов показателен.
Факторы [587] и [590] используют пороги 180 и 3600 секунд. Разные пороги нужны, потому что "достаточное" время сильно зависит от типа запроса: для короткой справки и для лонгрида адекватная длительность чтения отличается на порядок. Порог 3600 секунд в [590] вдобавок привязан к региону - локальная норма поведения учитывается отдельно.
Отдельный пласт - данные Яндекс.Браузера. Фактор [847] берёт логарифм среднего времени на хосте: логарифмирование сглаживает выбросы и не даёт нескольким аномально долгим сессиям перекосить оценку. Фактор [849] считает долю времени в регионе пользователя относительно всех регионов - то есть нормирует поведение на географию, отделяя локально сильные страницы от равномерно посещаемых.
Особняком стоит [1192] QueryDwellTimeBclmWeightedProximity. Это гибрид: классическая текстовая близость запроса и документа (BCLM, proximity термов), но взвешенная по dwell-time. Здесь текстовый сигнал перестаёт быть самостоятельным и начинает учитываться через призму поведения - совпадения слов ценятся тем выше, чем дольше на таких документах задерживаются. Это прямая иллюстрация того, что в современной формуле текст и поведение не разделены жёсткой стеной.
Мобайл как приоритет
Обратите внимание на префикс Mobile в ядре группы - [587], [588], [589], [590]. Ключевые поведенческие факторы long-click, losses и dwell измеряются именно на мобильных. Это отражает реальность мобильного трафика как основного и фиксирует, что поведение на смартфоне - первичный материал для оценки удовлетворённости, а не вторичная поправка к десктопу.
Длинные окна и статус RegDocStatic
Самое важное свойство группы спрятано в названиях: USLongPeriod и окна порядка 90-1600 дней. Поведение агрегируется по очень длинным периодам наблюдений.
Эти факторы статические по URL (тип RegDocStatic) - то есть это не реакция на сиюминутный клик конкретного пользователя, а накопленная за месяцы и годы репутация страницы по поведению. Один клик ничего не двигает. Сигнал - это устойчивая статистика по тысячам сессий за длинное окно.
SnippetCTR и GeoClicks: вход и географияПрактический вывод из длинных окон: накопить поведенческий вес нельзя за неделю, и точно так же его нельзя за неделю потерять. Это инерционный, медленный капитал страницы. Новый качественный документ будет набирать его постепенно, а просевший по качеству - терять с задержкой.
Группа QueryTitleSnippetCTR измеряет кликабельность пары "запрос - сниппет". Это сигнал верхней части воронки: насколько связка title плюс описание в выдаче побуждает кликнуть именно по этому результату при данном запросе. CTR сам по себе не означает удовлетворённость - кликнуть можно и на обманчивый сниппет, после чего сработает losses [589]. Поэтому CTR работает в паре с долгими кликами, а не вместо них.
Факторы [838-840] URLClicksMaxGeoCityFRC учитывают клики с привязкой к городу пользователя. Вместе с региональными dwell-факторами [590] и [849] это формирует геочувствительный поведенческий профиль: страница может быть сильной в одном городе и слабой в другом, и ранжирование это различает.
SEO-смысл: почему поведение не подделать честно
Главный практический итог разбора группы B.
- Поведение несёт максимальный вес, потому что меряет результат - доволен ли человек, - а не обещание релевантности, которое дают текст и ссылки.
- Награда и штраф разведены: долгий клик [588] поднимает, losses [589] отдельно опускает. Привлечь клик и не удержать - хуже, чем не привлечь вовсе.
- Окна 90-1600 дней и статус RegDocStatic делают сигнал инерционным. Быстрых рывков не бывает - ни вверх, ни вниз.
- Накрутку ловит антифрод. Эмулировать естественную статистику долгих кликов и dwell-time по длинному окну, по реальной географии, с данными Яндекс.Браузера - технически дорого и нестабильно, а паттерны накрутки распознаваемы.
Контекст серииЕдинственный устойчивый способ растить группу B - закрывать запрос лучше конкурентов: чтобы по запросу кликали (CTR и сниппет), оставались и читали (long-click и dwell), не возвращались в выдачу (минимум losses). Это не настройка под фактор, а буквально качество страницы, измеренное поведением. Поэтому поведенческие факторы и стоят на вершине - их нельзя обмануть, не сделав продукт реально лучше.
Этот разбор - часть серии по формуле ранжирования 2026. Каскад, общая формула и карта всех факторов в хаб-треде: viewtopic.php?t=1828