И ещё про host-size. У хоста есть условный объём полезных страниц, тех, что реально несут смысл и достойны индекса. Сотня тонких пустышек этот объём не растит, а часто наоборот, размывает оценку хоста. Качество выигрывает у количества. На что ты влияешь, а на что нет Это ядро урока, поэтому честно по трём корзинам. Прямой рычаг (тут ты решаешь):Попасть в индекс и хорошо ранжироваться, это два разных события, разнесённых во времени. Страница становится находимой быстро. А дорогие сигналы (ссылки, поведение, качество) досчитываются позже, в батч-цикле. Поэтому позиции дозревают днями и неделями.
- Технические директивы. noindex, robots, канонические, коды ответа, sitemap. Ты буквально говоришь, что брать, а что нет. Тут ошибка стоит дорого, потому что эффект мгновенный.
- Тонкость контента. Будет ли страница пустышкой или самодостаточным документом, решаешь ты. Это прямо влияет, в какой слой её положат.
- Чистка мусора. Какие url вообще существуют (фильтры, сортировки, пагинация, дубли) и попадают ли они роботу.
- Слой и host-size. Напрямую кнопки "положи меня в верхний слой" нет. Ты влияешь через накопление качества и авторитета, а пересчёт офлайновый и с лагом.
- Скорость переоценки. Свежей странице помогает хостовая статика, репутация домена, пока не накопятся свои сигналы. Если домен авторитетный, новые url заходят легче. Это ты строишь годами, а не за спринт.
- Сам момент апдейта индекса и пересчёта статики. Ты не ускоришь батч-цикл правками.
- Гарантия индексации. "Отправить на переобход" это просьба, а не команда. Тонкую страницу могут не взять, сколько ни жми.
- Раздели "в индексе" и "приносит трафик". Бери список проиндексированных url и матчи с теми, по которым реально есть показы и клики. Разница это твой мёртвый груз.
- Найди тонкие страницы: мало текста, шаблонная простыня, дубли по сути. Решай по каждой: усилить до самодостаточной, склеить каноникалом или закрыть noindex.
- Закрывай мусорные параметрические url от индекса осознанно. Пример минимального правила:
Код: Выделить всё
User-agent: * Disallow: /*?sort= Disallow: /*?filter= Disallow: /search/ - Проверяй реальный ответ сервера, а не то, что думаешь. Заголовок важнее догадок:
Код: Выделить всё
curl -sI https://site.ru/page/ | grep -i -E "HTTP|x-robots|canonical" - Следи за host-size осмысленно: цель не "больше страниц в индексе", а "больше качественных страниц и меньше пустышек". Доля полезных url важнее абсолютного числа.
- Поставил новую важную страницу, не дёргай её правками каждый день. Дай статике досчитаться. Частые правки перед каждым flush не ускоряют дозревание дорогих сигналов.
- "Проиндексировалось, значит, дальше попрёт трафик". Нет. Это вход в зал, а не место в первом ряду. Слой и статика решают отдельно.
- "Больше страниц в индексе всегда лучше". Нет. Тонкий шлак тянет вниз оценку хоста и съедает краулинговый бюджет.
- "Закрою лишнее в robots, и оно выпадет из индекса". Disallow запрещает обход, но уже проиндексированный url может болтаться в выдаче без сниппета. Чтобы выкинуть, нужен noindex или 404/410 на странице, доступной роботу.
- "Переотправлю на переобход 10 раз, проиндексируется быстрее". Спам переобходом ничего не ускоряет, а иногда выглядит подозрительно.
- "Выпала, значит, бан". Чаще это тихий съезд в холодный слой по статике или признание страницы тонкой, без всяких санкций.
- Выгрузи проиндексированные url и пересеки с теми, у кого есть показы. Какой процент индекса вообще работает.
- Прогони curl по 5-10 ключевым страницам и глянь живой код ответа, x-robots-tag и canonical. Совпадает с тем, что ты думал.
- Поищи на сайте параметрические и пагинационные url в индексе. Они должны там быть или это случайный мусор.
- Возьми 3 страницы, которые "в индексе, но без трафика". Они тонкие или просто в холодном слое. Это разные диагнозы и разное лечение.