Поведенческие факторы: главный вес современного ранжирования

Рейтинг: 0% · 0 голосов
Разбор устройства поиска и факторов ранжирования: реконструкция формулы, поведенческие, текстовые, ссылочные и хостовые факторы, антиспам, что живо и что давно мёртво. Аналитика на основе метаданных факторов web_production.
Ответить
Аватара пользователя
anna_seo
Сообщения: 58
Зарегистрирован: 11 май 2026, 05:31

Поведенческие факторы: главный вес современного ранжирования

Сообщение anna_seo »

Группа B - Поведение. Почему это ядро современного ранжирования

Если выстраивать факторы из утечки метаданных web_production (1923 фактора) по реальному вкладу в позицию, поведенческая группа стоит на вершине. Текст и ссылки задают, может ли документ в принципе релевантно ответить на запрос. Поведение отвечает на другой вопрос: а доволен ли пользователь тем, что получил. Именно второй вопрос Яндекс решает в последнюю очередь и с наибольшим весом, потому что это единственный сигнал, который меряет результат, а не намерение.

Группа B измеряет, что человек делает с выдачей: остался на странице и читал (хорошо) или вернулся обратно в поисковую выдачу за следующим результатом (плохо), сколько времени провёл, и - что критично - как это выглядит на мобильных устройствах.

Сводная формула группы

Код: Выделить всё

B = wlc*LongClickProb - wls*LossesProb + wdt*DwellTime + wctr*SnippetCTR + wgeo*GeoClicks
Дисклеймер: веса (wlc, wls, wdt, wctr, wgeo) здесь иллюстративны. Реальные коэффициенты обучаемы, проприетарны и нелинейны - это не сумма с фиксированными множителями, а вход в обученную формулу. Всё ниже - реконструкция логики по именам факторов из метаданных, а не воспроизведение боевого ранжирования.
Конкретные факторы и их индексы

Код: Выделить всё

LongClickProb
  [588] USLongPeriodUrlMobileLongClickProb
        вероятность "долгого клика" - пользователь
        кликнул и остался. Мобайл, длинное окно
        наблюдений (порядка 1600 дней).

LossesProb
  [589] USLongPeriodUrlMobileLossesProb
        вероятность "потери" - пользователь отскочил
        назад в выдачу. Это ПРЯМОЙ ШТРАФ.

DwellTime
  [587] USLongPeriodUrlMobileDt180Avg
        среднее время на странице, порог 180 секунд.
  [590] USLongPeriodUrlMobileDt3600AvgReg
        то же, но порог 3600 секунд, с региональной
        привязкой.
  [847] BrowserHostCntDwellTimeLog
        логарифм среднего времени на хосте по данным
        Яндекс.Браузера.
  [849] BrowserUrlDwellTimeRegionFrc
        доля: время на странице в регионе пользователя
        к времени по всем регионам.
  [1192] QueryDwellTimeBclmWeightedProximity
        текстовая близость (BCLM/proximity), ВЗВЕШЕННАЯ
        по dwell-time. Текст, помноженный на поведение.

SnippetCTR
  группа QueryTitleSnippetCTR
        кликабельность пары "запрос - сниппет" в выдаче.

GeoClicks
  [838-840] URLClicksMaxGeoCityFRC*
        клики с учётом города пользователя.
Long-click и losses: симметрия награды и штрафа

Вся группа держится на одной паре противоположностей.

Долгий клик (long-click). Фактор [588] оценивает вероятность того, что после перехода из выдачи пользователь не вернулся быстро, а провёл на странице содержательное время. Это сигнал удовлетворённости: страница закрыла запрос, искать дальше не пришлось. Долгий клик - это положительный голос за документ.

Потеря (loss). Фактор [589] - зеркальный. Это вероятность того, что пользователь отскочил обратно в выдачу, чтобы выбрать другой результат. На уровне здравого смысла это "обманул ожидание": сниппет пообещал ответ, страница не дала. Важно, что losses вынесен в отдельный фактор и работает как прямой штраф, а не просто как отсутствие награды. Документ может набирать долгие клики от одной аудитории и одновременно копить потери от другой - и штраф будет учтён явно.
Формула группы по сути сводится к одной мысли: B приблизительно равно (остался и читал) минус (отскочил). Награда за удержание и штраф за возврат - две независимые величины, а не один знакопеременный сигнал.
Dwell-time: время как мера качества

Dwell-time - это время между кликом по результату и возвратом в выдачу. Группа B меряет его сразу несколькими способами, и набор порогов показателен.

Факторы [587] и [590] используют пороги 180 и 3600 секунд. Разные пороги нужны, потому что "достаточное" время сильно зависит от типа запроса: для короткой справки и для лонгрида адекватная длительность чтения отличается на порядок. Порог 3600 секунд в [590] вдобавок привязан к региону - локальная норма поведения учитывается отдельно.

Отдельный пласт - данные Яндекс.Браузера. Фактор [847] берёт логарифм среднего времени на хосте: логарифмирование сглаживает выбросы и не даёт нескольким аномально долгим сессиям перекосить оценку. Фактор [849] считает долю времени в регионе пользователя относительно всех регионов - то есть нормирует поведение на географию, отделяя локально сильные страницы от равномерно посещаемых.

Особняком стоит [1192] QueryDwellTimeBclmWeightedProximity. Это гибрид: классическая текстовая близость запроса и документа (BCLM, proximity термов), но взвешенная по dwell-time. Здесь текстовый сигнал перестаёт быть самостоятельным и начинает учитываться через призму поведения - совпадения слов ценятся тем выше, чем дольше на таких документах задерживаются. Это прямая иллюстрация того, что в современной формуле текст и поведение не разделены жёсткой стеной.

Мобайл как приоритет

Обратите внимание на префикс Mobile в ядре группы - [587], [588], [589], [590]. Ключевые поведенческие факторы long-click, losses и dwell измеряются именно на мобильных. Это отражает реальность мобильного трафика как основного и фиксирует, что поведение на смартфоне - первичный материал для оценки удовлетворённости, а не вторичная поправка к десктопу.

Длинные окна и статус RegDocStatic

Самое важное свойство группы спрятано в названиях: USLongPeriod и окна порядка 90-1600 дней. Поведение агрегируется по очень длинным периодам наблюдений.

Эти факторы статические по URL (тип RegDocStatic) - то есть это не реакция на сиюминутный клик конкретного пользователя, а накопленная за месяцы и годы репутация страницы по поведению. Один клик ничего не двигает. Сигнал - это устойчивая статистика по тысячам сессий за длинное окно.
Практический вывод из длинных окон: накопить поведенческий вес нельзя за неделю, и точно так же его нельзя за неделю потерять. Это инерционный, медленный капитал страницы. Новый качественный документ будет набирать его постепенно, а просевший по качеству - терять с задержкой.
SnippetCTR и GeoClicks: вход и география

Группа QueryTitleSnippetCTR измеряет кликабельность пары "запрос - сниппет". Это сигнал верхней части воронки: насколько связка title плюс описание в выдаче побуждает кликнуть именно по этому результату при данном запросе. CTR сам по себе не означает удовлетворённость - кликнуть можно и на обманчивый сниппет, после чего сработает losses [589]. Поэтому CTR работает в паре с долгими кликами, а не вместо них.

Факторы [838-840] URLClicksMaxGeoCityFRC учитывают клики с привязкой к городу пользователя. Вместе с региональными dwell-факторами [590] и [849] это формирует геочувствительный поведенческий профиль: страница может быть сильной в одном городе и слабой в другом, и ранжирование это различает.

SEO-смысл: почему поведение не подделать честно

Главный практический итог разбора группы B.
  • Поведение несёт максимальный вес, потому что меряет результат - доволен ли человек, - а не обещание релевантности, которое дают текст и ссылки.
  • Награда и штраф разведены: долгий клик [588] поднимает, losses [589] отдельно опускает. Привлечь клик и не удержать - хуже, чем не привлечь вовсе.
  • Окна 90-1600 дней и статус RegDocStatic делают сигнал инерционным. Быстрых рывков не бывает - ни вверх, ни вниз.
  • Накрутку ловит антифрод. Эмулировать естественную статистику долгих кликов и dwell-time по длинному окну, по реальной географии, с данными Яндекс.Браузера - технически дорого и нестабильно, а паттерны накрутки распознаваемы.
Единственный устойчивый способ растить группу B - закрывать запрос лучше конкурентов: чтобы по запросу кликали (CTR и сниппет), оставались и читали (long-click и dwell), не возвращались в выдачу (минимум losses). Это не настройка под фактор, а буквально качество страницы, измеренное поведением. Поэтому поведенческие факторы и стоят на вершине - их нельзя обмануть, не сделав продукт реально лучше.
Контекст серии
Этот разбор - часть серии по формуле ранжирования 2026. Каскад, общая формула и карта всех факторов в хаб-треде: viewtopic.php?t=1828
👍 ❤️ 🔥 😄 🤔
Ответить
Поделиться темой: ✈ Telegram VK

Вернуться в «SEO и факторы ранжирования»

Кто сейчас на конференции

Сейчас этот форум просматривают: нет зарегистрированных пользователей и 1 гость