pgvector тащит или нужна отдельная векторная БД для RAG?

stas2886 · Пн май 18, 2026 6:26 pm

Делаем RAG-поиск по корпоративной базе знаний, ~2 млн чанков, эмбеддинги 1536 размерности. Сейчас всё в pgvector. Народ пугает что на таких объёмах надо Qdrant/Milvus. Реально надо или pgvector вывезет?

danila · Ср май 20, 2026 4:34 pm

2 млн векторов pgvector вывезет спокойно, особенно с HNSW индексом который добавили в 0.5+. Главное не используй ivfflat если у тебя данные меняются, и держи достаточно RAM под индекс.

ruslan_pro · Чт май 21, 2026 6:08 am

Подтверждаю, у нас 5 млн на pgvector + HNSW, recall нормальный, latency p95 около 40мс. Плюс гигантский плюс — ты не плодишь ещё одну БД и делаешь metadata-фильтрацию обычным WHERE в том же запросе.

corevue202 · Чт май 21, 2026 10:45 am

А вот по поводу фильтрации — у нас как раз pgvector затупил когда добавили жёсткие WHERE по метаданным поверх векторного поиска. HNSW и pre-filtering плохо дружат. В Qdrant с этим из коробки лучше.

svetlana_js · Чт май 21, 2026 11:13 am

О, фильтрация по метаданным у нас тоже будет активная (по отделу, по дате документа). Это меняет картину?

savva_io · Чт май 21, 2026 11:32 am

Меняет, но не критично. В pgvector 0.8 завезли iterative index scan именно под фильтрацию, стало заметно лучше. Если фильтры не отрезают 99% данных — будет ок. Если отрезают — тогда да, специализированная БД выигрывает.

lev_sql · Пт май 22, 2026 8:52 am

Понял, обновлюсь на 0.8 и прогоню бенч с реальными фильтрами. Если recall просядет — посмотрю Qdrant. Спасибо, очень предметно!

matvey5884 · Пт май 22, 2026 3:13 pm

Ещё совет: квантуй векторы до halfvec если память жмёт, на 1536 это режет индекс почти вдвое почти без потери качества.

nethex8167 · Пт июн 05, 2026 5:15 pm

У меня после этого способа всё завелось, спасибо за наводку.

pixeldns752 · Сб июн 06, 2026 11:20 am

А есть смысл это делать в проде или только для локалки подходит?

Cyberlake

pgvector тащит или нужна отдельная векторная БД для RAG?

pgvector тащит или нужна отдельная векторная БД для RAG?

Re: pgvector тащит или нужна отдельная векторная БД для RAG?

Re: pgvector тащит или нужна отдельная векторная БД для RAG?

Re: pgvector тащит или нужна отдельная векторная БД для RAG?

Re: pgvector тащит или нужна отдельная векторная БД для RAG?

Re: pgvector тащит или нужна отдельная векторная БД для RAG?

Re: pgvector тащит или нужна отдельная векторная БД для RAG?

Re: pgvector тащит или нужна отдельная векторная БД для RAG?

Re: pgvector тащит или нужна отдельная векторная БД для RAG?

Re: pgvector тащит или нужна отдельная векторная БД для RAG?

Кто сейчас на конференции