Эта группа описывает то, что о странице "говорят" извне. Не содержимое самого документа, а внешние тексты, которые ведут к нему: анкоры входящих ссылок, тексты переходов по цепочкам, запросы, по которым на эту страницу реально ходят. Если упростить, группа A отвечает на вопрос - насколько внешние тексты и запросы, ведущие на страницу, совпадают с текущим запросом пользователя.
По метаданным утечки (web_production, 1923 фактора) внутри группы складываются четыре относительно независимых блока. Ниже - реконструированная схема их вклада.
Код: Выделить всё
A = wq2u*QueryToUrl + wanc*AnchorText + whop*HopText + wfrc*FRC
QueryToUrl [761] QUBm15Weighted
BM25 по индексу "документ -> запросы, по которым на него переходят"
AnchorText группа Annotation / LinkBM25
релевантность анкоров входящих ссылок
HopText [666] NHopTextBclmWeighted
[795] NHopTextBclmPlane
тексты из цепочек переходов (hops)
FRC [765] NHopChainsCountFrc + browser-cosine аннотации
Fast Rank Candidates по аннотациям и браузингу
QueryToUrl - запросный индекс документаВеса wq2u, wanc, whop, wfrc здесь иллюстративны. Реальные коэффициенты обучаемы, проприетарны и в метаданных не фигурируют - вся схема является реконструкцией по именам и индексам факторов, а не выгрузкой формулы.
Центральный фактор блока - [761] QUBm15Weighted. Это BM25, но посчитанный не по тексту страницы, а по специальному индексу вида "документ -> запросы, по которым на него переходят". То есть для каждого URL накапливается коллекция запросов, после которых пользователи на этот URL кликали и оставались. Эта коллекция трактуется как отдельный "текст документа", и по нему считается релевантность к текущему запросу через взвешенный BM25 (Bm15 в имени - вариант с определённой нормировкой длины).
Фактор сильный именно потому, что он замыкает поисковую систему на саму себя: успешный клик в выдаче по запросу Q делает страницу более релевантной запросу Q и похожим на него. Накрутить его текстовыми методами нельзя - он питается логами переходов, а не разметкой.Принципиально важно: это не про то, что написано на странице, и не про то, что написано в ссылках на неё. Это про то, по каким запросам страница уже доказала свою полезность поведением реальных пользователей.
AnchorText - анкоры входящих ссылок
Это исторически самый известный ссылочный сигнал: текст, которым на страницу ссылаются. В метаданных он живёт в группе Annotation / LinkBM25 - релевантность анкоров входящих ссылок к запросу, посчитанная как BM25 по объединённому "анкорному тексту" документа.
Здесь же проходит ключевой водораздел всей группы. Большая часть старых анкорных слотов в метаданных мертва. Классические семейства - Xref и LegacyLR - присутствуют как legacy, но это балласт: вес у них околонулевой, они не вносят значимого вклада. То, что раньше было ядром ссылочного ранжирования, превратилось в исторический хвост.
HopText - тексты цепочек переходовКлассика Xref / LegacyLR / LinkBM25 в её прежнем виде мертва. Живёт аннотационно-браузерный слой - то, что собирается из реального поведения и из аннотаций переходов, а не из голого факта проставленной ссылки.
HopText - наиболее интересная и недооценённая часть группы. Это тексты, извлечённые из цепочек переходов (hops): не одиночная ссылка A -> B, а последовательность переходов пользователя, вдоль которой накапливается контекст.
Код: Выделить всё
[666] NHopTextBclmWeighted взвешенный BCLM по тексту хопов
[795] NHopTextBclmPlane "плоский" вариант той же метрики
Разница между двумя индексами - в нормировке. [666] NHopTextBclmWeighted - взвешенный вариант, где вклад хопов балансируется (предположительно по их числу, авторитетности или длине цепочки). [795] NHopTextBclmPlane - "плоский" вариант без этого взвешивания. Наличие обоих в живом наборе говорит о том, что модель использует и нормированную, и сырую версию сигнала одновременно.
Принципиально, что HopText - это уже не про отдельную ссылку, а про навигационный контекст вокруг неё. Сигнал собирается из аннотаций реального браузинга, и в этом он ближе к QueryToUrl, чем к классическому AnchorText.
FRC - Fast Rank Candidates по аннотациям
Четвёртый блок - FRC, Fast Rank Candidates. Это слой быстрого предотбора кандидатов на основе аннотаций и браузинга, отдельный от тяжёлого финального скоринга.
Код: Выделить всё
[765] NHopChainsCountFrc счётчик цепочек хопов на этапе FRC
+ browser-cosine аннотации
Что это меняет для SEO
Главный практический вывод группы A прямой и неприятный для классической ссылочной оптимизации.
- Покупные анкоры бьют в мёртвое. Слой, на который они исторически воздействовали - Xref, LegacyLR, старый LinkBM25 - в живом наборе факторов фактически обнулён. Точечная работа над текстами ссылок даёт всё меньше, потому что соответствующие слоты больше не несут веса.
- Живёт аннотационно-браузерный слой: QueryToUrl [761], HopText [666] / [795], FRC [765]. Все три блока питаются не разметкой ссылок, а реальным поведением - кликами по запросам и цепочками переходов.
- Эти сигналы накрутить текстом нельзя. Чтобы влиять на QueryToUrl, нужны реальные успешные переходы по целевым запросам. Чтобы влиять на HopText и FRC - реальные навигационные цепочки, ведущие на документ в осмысленном контексте.
Дисклеймер. Всё изложенное - реконструкция по именам и индексам факторов из метаданных. Конкретные веса блоков не выгружаются и являются обучаемыми и проприетарными; приведённая формула отражает структуру вклада, а не точные коэффициенты ранжирования.Группа A окончательно сместилась от вопроса "кто и какими словами на тебя ссылается" к вопросу "по каким запросам и через какие переходы к тебе реально приходят". Ссылочный текст как таковой выродился в legacy; на его месте - аннотации поведения. Бюджет, который раньше уходил в анкоры, в этой модели уходит в пустоту.
Контекст серии
Этот разбор - часть серии по формуле ранжирования 2026. Каскад, общая формула и карта всех факторов в хаб-треде: viewtopic.php?t=1828