Логика простая. Любой сигнал, который легко подделать, рано или поздно начинают подделывать все массово. Тогда он перестаёт отличать хорошее от плохого, и модель сама учится его игнорировать или резать. Это многолетняя гонка вооружений, и накрутчики в ней всегда на шаг позади. Из этого следует, где у тебя реальный рычаг. Сильный рычаг (трудно подделать честно):Вес фактора обратно пропорционален лёгкости его накрутки. Чем проще нарисовать сигнал, тем меньше модель на него опирается.
- Удовлетворённость пользователя. Человек зашёл, нашёл ответ, не вернулся в выдачу искать другой результат. Это поведенческое, и подделать его в масштабе дорого и палевно.
- Смысловое соответствие интенту. Не "вхождение ключа", а реально ли страница отвечает на то, что человек имел в виду. Современные текстовые модели понимают синонимы и словоформы, а не считают точные совпадения.
- Общее качество хоста. Накопленная репутация всего домена, а не отдельной страницы.
- Ссылки. Они ещё работают как сигнал, но их вес давно падает, а покупная масса бьёт по семейству с высоким риском обнуления. Естественные ссылки на годный контент - да. Закупка тысячами - выброшенные деньги плюс риск под фильтр.
- Тип запроса. Ты не управляешь им, но обязан учитывать. Коммерческий, информационный, локальный, свежестный запросы тянут РАЗНЫЕ факторы. Оптимизировать "вообще" бессмысленно - только под класс запроса.
- Веса модели. Ты их не знаешь и не настроишь.
- Скорость пересчёта. Лаг встроен в систему, его не ускорить.
- Возраст домена сам по себе. Это не кнопка, это просто число в логе.
- Определи класс запроса ПЕРЕД оптимизацией. Посмотри живую выдачу: что там - магазины, статьи, карты, свежие новости. Под это и подгоняй формат страницы.
- Меряй поведение, а не плотность. Глубина, время на странице, возвраты в выдачу (pogo-sticking), доля long-click. Это твой главный термометр.
- Закрывай интент целиком на одной странице, чтобы человеку не пришлось искать дальше. Это прямой драйвер удовлетворённости.
- Чисти хост. Выноси или закрывай тонкие, дублирующие, устаревшие разделы - они тянут хостовый агрегат вниз.
- Раскрывай тему синонимами и смежными формулировками, а не повтором одной точной фразы. Набивка не засчитывается, а антиспам-потолок по тексту - вполне.
- Любой "фактор X" из чужого списка прогоняй через правило накрутки. Легко нарисовать - почти наверняка не весит. Не трать на него ресурс.
Чтобы не гадать по чужим чеклистам, держи ориентировочную раскладку веса по группам факторов в современном поиске. Это порядок величин, а не точные коэффициенты (они обучаемы моделью и закрыты), но пропорции честные. Колонка про робота показывает, считается ли сигнал заранее, на этапе обхода и индексации, или уже в рантайме под конкретный запрос.
Код: Выделить всё
Группа | Доля | Источник | Робот (этап индексации)?
--------------------+----------+---------------------------------------------------------+----------------------------------------------
B Поведение | 30-40% | логи поиска / Метрика / Браузер / Yabar | Нет (робот лишь хранит документ-носитель)
T Нейро-текст | 25-35% | рантайм (запрос-документ) + эмбеддинги при индексации | Частично (только документная сторона)
Q Запрос-документ | 8-12% | рантайм базового поиска | Нет
H Хост/владелец | 8-12% | агрегаты хоста и владельца при индексации | Да (но часть H - поведение из Бара/Браузера)
A Аннотации/ссылки | 5-10% | ссылочный граф и анкоры | Да (но классика ссылочных факторов мертва)
Мифы и устаревшееПрактический вывод. Львиную долю веса несут поведение и смысловое соответствие интенту - ровно то, что труднее всего подделать честно. Запросные и ссылочные сигналы важны, но их потолок заметно ниже, чем продают в гайдах. И главное: почти всё весомое считается НЕ на этапе индексации, а в рантайме по логам поведения и нейросетям. Значит твои правки на сайте влияют на ВХОД конвейера, а финальный вес собирается из реакций живых людей. Отсюда и лаг в недели, и бессмысленность накрутки.
Если фактор можно "включить" одной правкой в админке за пять минут - почти наверняка он либо никогда не весил, либо его специально обнулили.
- Meta keywords. Мёртвый слот, поисковики игнорируют его много лет. Заполнять - чистый ритуал.
- Плотность ключевых слов. Никакого "оптимального процента" нет. Современный поиск считает смысл, а за набивку прилетает антиспам.
- Возраст домена как самостоятельный фактор. Старый дроп без качества не ранжируется. Коррелирует с возрастом обычно накопленная репутация, а не дата регистрации.
- Масса покупных ссылок. Бьёт в падающее семейство с высоким риском обнуления. Деньги в трубу плюс шанс под фильтр.
- Накрутка кликов. Поведение агрегируется и фильтруется, ботов вычищают, а паттерн накрутки сам становится сигналом подозрительности.
- Открой исходник пары страниц и посмотри, не набит ли там meta keywords и не сидишь ли ты на старой "плотности". Если да - это мёртвый груз, можно спокойно выкидывать из своих процессов.
- Возьми 5-10 своих ключевых запросов и глянь живую выдачу. Совпадает ли ТИП твоих страниц с тем, что реально ранжируется? Если ты лепишь статью под коммерческий запрос, никакие факторы не спасут.
- В метрике найди страницы с высоким процентом возвратов в поиск (короткие визиты, отказы). Это кандидаты на провал по удовлетворённости - чини интент там в первую очередь.
- Посмотри на разделы-помойки: тонкие, дублирующие, заброшенные. Прикинь, что они делают с хостовым качеством, и составь план зачистки.