Сам курс тут: learn/search-engines
Зачем. Нормального русскоязычного материала, который проводит по ВСЕМУ конвейеру поиска, от обхода веба до того, почему конкретный документ оказался на третьей позиции, почти нет. Есть либо академические талмуды про information retrieval, либо seo-инфоцыгане про плотность ключевиков. Хотелось середину: честно и технически, но читаемо.
Что внутри. 23 модуля и сквозной приём "путь одного запроса": одну и ту же историю (юзер что-то спросил) прослеживаем через весь конвейер обход -> индекс -> факторы -> ранжирование -> выдача -> постобработка -> измерение.
Несколько глав, которые стоит глянуть первыми:
- текстовая релевантность (BM25, почему tf насыщается, нормализация длины): viewtopic.php?t=1796
- ссылочный граф (PageRank, damping, почему фермы ссылок его ломают): viewtopic.php?t=1797
- таксономия факторов, какие живые, какие мёртвые и почему: viewtopic.php?t=1798
- нейросетевой поиск (dense retrieval, гибрид с BM25, кросс-энкодеры): viewtopic.php?t=1800
- поведенческие сигналы и клик-модели: viewtopic.php?t=1801
- SEO как прикладная глава, на какие звенья реально влияешь, а на какие нет: viewtopic.php?t=1810
Формат: конспект, частые заблуждения, лаба и контрольные вопросы в каждой главе. Под каждым уроком можно задавать вопросы и спорить, комментарии открыты.
Ещё раз ссылка на курс: learn/search-engines
Если найдёте косяк или захотите, чтобы какую-то тему раскопал глубже, пишите тут или под уроком.