Аннотации, анкоры и ссылочные факторы

Рейтинг: 0% · 0 голосов
Разбор устройства поиска и факторов ранжирования: реконструкция формулы, поведенческие, текстовые, ссылочные и хостовые факторы, антиспам, что живо и что давно мёртво. Аналитика на основе метаданных факторов web_production.
Ответить
Аватара пользователя
anna_seo
Сообщения: 58
Зарегистрирован: 11 май 2026, 05:31

Аннотации, анкоры и ссылочные факторы

Сообщение anna_seo »

Аннотации, анкоры и ссылочные факторы: группа A

Эта группа описывает то, что о странице "говорят" извне. Не содержимое самого документа, а внешние тексты, которые ведут к нему: анкоры входящих ссылок, тексты переходов по цепочкам, запросы, по которым на эту страницу реально ходят. Если упростить, группа A отвечает на вопрос - насколько внешние тексты и запросы, ведущие на страницу, совпадают с текущим запросом пользователя.

По метаданным утечки (web_production, 1923 фактора) внутри группы складываются четыре относительно независимых блока. Ниже - реконструированная схема их вклада.

Код: Выделить всё

A = wq2u*QueryToUrl + wanc*AnchorText + whop*HopText + wfrc*FRC

QueryToUrl  [761] QUBm15Weighted
            BM25 по индексу "документ -> запросы, по которым на него переходят"

AnchorText  группа Annotation / LinkBM25
            релевантность анкоров входящих ссылок

HopText     [666] NHopTextBclmWeighted
            [795] NHopTextBclmPlane
            тексты из цепочек переходов (hops)

FRC         [765] NHopChainsCountFrc + browser-cosine аннотации
            Fast Rank Candidates по аннотациям и браузингу
Веса wq2u, wanc, whop, wfrc здесь иллюстративны. Реальные коэффициенты обучаемы, проприетарны и в метаданных не фигурируют - вся схема является реконструкцией по именам и индексам факторов, а не выгрузкой формулы.
QueryToUrl - запросный индекс документа

Центральный фактор блока - [761] QUBm15Weighted. Это BM25, но посчитанный не по тексту страницы, а по специальному индексу вида "документ -> запросы, по которым на него переходят". То есть для каждого URL накапливается коллекция запросов, после которых пользователи на этот URL кликали и оставались. Эта коллекция трактуется как отдельный "текст документа", и по нему считается релевантность к текущему запросу через взвешенный BM25 (Bm15 в имени - вариант с определённой нормировкой длины).
Принципиально важно: это не про то, что написано на странице, и не про то, что написано в ссылках на неё. Это про то, по каким запросам страница уже доказала свою полезность поведением реальных пользователей.
Фактор сильный именно потому, что он замыкает поисковую систему на саму себя: успешный клик в выдаче по запросу Q делает страницу более релевантной запросу Q и похожим на него. Накрутить его текстовыми методами нельзя - он питается логами переходов, а не разметкой.

AnchorText - анкоры входящих ссылок

Это исторически самый известный ссылочный сигнал: текст, которым на страницу ссылаются. В метаданных он живёт в группе Annotation / LinkBM25 - релевантность анкоров входящих ссылок к запросу, посчитанная как BM25 по объединённому "анкорному тексту" документа.

Здесь же проходит ключевой водораздел всей группы. Большая часть старых анкорных слотов в метаданных мертва. Классические семейства - Xref и LegacyLR - присутствуют как legacy, но это балласт: вес у них околонулевой, они не вносят значимого вклада. То, что раньше было ядром ссылочного ранжирования, превратилось в исторический хвост.
Классика Xref / LegacyLR / LinkBM25 в её прежнем виде мертва. Живёт аннотационно-браузерный слой - то, что собирается из реального поведения и из аннотаций переходов, а не из голого факта проставленной ссылки.
HopText - тексты цепочек переходов

HopText - наиболее интересная и недооценённая часть группы. Это тексты, извлечённые из цепочек переходов (hops): не одиночная ссылка A -> B, а последовательность переходов пользователя, вдоль которой накапливается контекст.

Код: Выделить всё

[666] NHopTextBclmWeighted   взвешенный BCLM по тексту хопов
[795] NHopTextBclmPlane      "плоский" вариант той же метрики
BCLM - семейство метрик соответствия запроса тексту с учётом близости и формы вхождений терминов, более чувствительное к структуре совпадения, чем сырой BM25. Применённое к тексту хопов, оно оценивает, насколько контекст цепочки переходов, приведшей на страницу, согласуется с запросом.

Разница между двумя индексами - в нормировке. [666] NHopTextBclmWeighted - взвешенный вариант, где вклад хопов балансируется (предположительно по их числу, авторитетности или длине цепочки). [795] NHopTextBclmPlane - "плоский" вариант без этого взвешивания. Наличие обоих в живом наборе говорит о том, что модель использует и нормированную, и сырую версию сигнала одновременно.

Принципиально, что HopText - это уже не про отдельную ссылку, а про навигационный контекст вокруг неё. Сигнал собирается из аннотаций реального браузинга, и в этом он ближе к QueryToUrl, чем к классическому AnchorText.

FRC - Fast Rank Candidates по аннотациям

Четвёртый блок - FRC, Fast Rank Candidates. Это слой быстрого предотбора кандидатов на основе аннотаций и браузинга, отдельный от тяжёлого финального скоринга.

Код: Выделить всё

[765] NHopChainsCountFrc   счётчик цепочек хопов на этапе FRC
                          + browser-cosine аннотации
[765] NHopChainsCountFrc - это счётчик цепочек переходов, ведущих на документ, посчитанный на стадии FRC. К нему примыкает косинусная близость браузерных аннотаций (browser-cosine): насколько аннотации, собранные из браузинга вокруг документа, по векторному представлению близки запросу. Функция этого блока - дать дешёвую и быструю оценку того, стоит ли документ дальнейшего рассмотрения, опираясь на плотность и релевантность браузерного следа, а не на текст страницы.

Что это меняет для SEO

Главный практический вывод группы A прямой и неприятный для классической ссылочной оптимизации.
  • Покупные анкоры бьют в мёртвое. Слой, на который они исторически воздействовали - Xref, LegacyLR, старый LinkBM25 - в живом наборе факторов фактически обнулён. Точечная работа над текстами ссылок даёт всё меньше, потому что соответствующие слоты больше не несут веса.
  • Живёт аннотационно-браузерный слой: QueryToUrl [761], HopText [666] / [795], FRC [765]. Все три блока питаются не разметкой ссылок, а реальным поведением - кликами по запросам и цепочками переходов.
  • Эти сигналы накрутить текстом нельзя. Чтобы влиять на QueryToUrl, нужны реальные успешные переходы по целевым запросам. Чтобы влиять на HopText и FRC - реальные навигационные цепочки, ведущие на документ в осмысленном контексте.
Группа A окончательно сместилась от вопроса "кто и какими словами на тебя ссылается" к вопросу "по каким запросам и через какие переходы к тебе реально приходят". Ссылочный текст как таковой выродился в legacy; на его месте - аннотации поведения. Бюджет, который раньше уходил в анкоры, в этой модели уходит в пустоту.
Дисклеймер. Всё изложенное - реконструкция по именам и индексам факторов из метаданных. Конкретные веса блоков не выгружаются и являются обучаемыми и проприетарными; приведённая формула отражает структуру вклада, а не точные коэффициенты ранжирования.

Контекст серии
Этот разбор - часть серии по формуле ранжирования 2026. Каскад, общая формула и карта всех факторов в хаб-треде: viewtopic.php?t=1828
👍 ❤️ 🔥 😄 🤔
Ответить
Поделиться темой: ✈ Telegram VK

Вернуться в «SEO и факторы ранжирования»

Кто сейчас на конференции

Сейчас этот форум просматривают: нет зарегистрированных пользователей и 0 гостей