pgvector тащит или нужна отдельная векторная БД для RAG?

Теги: #VPN
Рейтинг: 48.4% · 25 голосов
SQL и NoSQL: PostgreSQL, MySQL, Redis, MongoDB, ClickHouse, ElasticSearch — проектирование схем, индексы, репликация и оптимизация запросов.
Аватара пользователя
stas2886
Сообщения: 1
Зарегистрирован: Чт май 14, 2026 9:04 pm

pgvector тащит или нужна отдельная векторная БД для RAG?

Сообщение stas2886 »

Делаем RAG-поиск по корпоративной базе знаний, ~2 млн чанков, эмбеддинги 1536 размерности. Сейчас всё в pgvector. Народ пугает что на таких объёмах надо Qdrant/Milvus. Реально надо или pgvector вывезет?
👍4 ❤️ 🔥4 😄2 🤔2
✔ Лучший ответ сформирован автоматически — vadim9808
Мы как раз прошли этот путь — 1.8 млн чанков, 1536d от text-embedding-3-small, pgvector 0.7.0 на PG 16. При дефолтном HNSW-индексе (m=16, ef_construction=64) ANN-поиск занимал 180-250 мс на запрос, что нас не устраивало. Подняли ef_construction до 128, добавили index maintenance workers, прописали SET hnsw.ef_search = 100 на уровне сессии — упали до 40-60 мс. На 2 млн чанков pgvector вполне тянет…
Перейти к ответу →
Аватара пользователя
danila
Сообщения: 2
Зарегистрирован: Пн май 18, 2026 1:28 pm

Re: pgvector тащит или нужна отдельная векторная БД для RAG?

Сообщение danila »

2 млн векторов pgvector вывезет спокойно, особенно с HNSW индексом который добавили в 0.5+. Главное не используй ivfflat если у тебя данные меняются, и держи достаточно RAM под индекс.
👍1 ❤️1 🔥 😄 🤔
Аватара пользователя
ruslan_pro
Сообщения: 24
Зарегистрирован: Чт май 14, 2026 3:04 am

Re: pgvector тащит или нужна отдельная векторная БД для RAG?

Сообщение ruslan_pro »

Подтверждаю, у нас 5 млн на pgvector + HNSW, recall нормальный, latency p95 около 40мс. Плюс гигантский плюс — ты не плодишь ещё одну БД и делаешь metadata-фильтрацию обычным WHERE в том же запросе.
👍4 ❤️1 🔥1 😄 🤔
Аватара пользователя
corevue202
Сообщения: 1
Зарегистрирован: Вс май 17, 2026 7:36 am

Re: pgvector тащит или нужна отдельная векторная БД для RAG?

Сообщение corevue202 »

А вот по поводу фильтрации — у нас как раз pgvector затупил когда добавили жёсткие WHERE по метаданным поверх векторного поиска. HNSW и pre-filtering плохо дружат. В Qdrant с этим из коробки лучше.
👍1 ❤️ 🔥 😄 🤔1
Аватара пользователя
svetlana_js
Сообщения: 25
Зарегистрирован: Пн май 11, 2026 2:56 pm

Re: pgvector тащит или нужна отдельная векторная БД для RAG?

Сообщение svetlana_js »

О, фильтрация по метаданным у нас тоже будет активная (по отделу, по дате документа). Это меняет картину?
👍1 ❤️ 🔥 😄 🤔
Аватара пользователя
savva_io
Сообщения: 41
Зарегистрирован: Вс май 10, 2026 9:03 pm

Re: pgvector тащит или нужна отдельная векторная БД для RAG?

Сообщение savva_io »

Меняет, но не критично. В pgvector 0.8 завезли iterative index scan именно под фильтрацию, стало заметно лучше. Если фильтры не отрезают 99% данных — будет ок. Если отрезают — тогда да, специализированная БД выигрывает.
👍 ❤️ 🔥 😄 🤔
Аватара пользователя
lev_sql
Сообщения: 2
Зарегистрирован: Чт май 21, 2026 6:59 am

Re: pgvector тащит или нужна отдельная векторная БД для RAG?

Сообщение lev_sql »

Понял, обновлюсь на 0.8 и прогоню бенч с реальными фильтрами. Если recall просядет — посмотрю Qdrant. Спасибо, очень предметно!
👍2 ❤️ 🔥 😄 🤔1
Аватара пользователя
matvey5884
Сообщения: 24
Зарегистрирован: Вт май 12, 2026 11:35 pm

Re: pgvector тащит или нужна отдельная векторная БД для RAG?

Сообщение matvey5884 »

Ещё совет: квантуй векторы до halfvec если память жмёт, на 1536 это режет индекс почти вдвое почти без потери качества.
👍2 ❤️1 🔥1 😄2 🤔
Аватара пользователя
nethex8167
Сообщения: 12
Зарегистрирован: Ср май 13, 2026 10:06 am

Re: pgvector тащит или нужна отдельная векторная БД для RAG?

Сообщение nethex8167 »

У меня после этого способа всё завелось, спасибо за наводку.
👍 ❤️ 🔥 😄 🤔
Аватара пользователя
pixeldns752
Сообщения: 15
Зарегистрирован: Пн май 11, 2026 10:41 am

Re: pgvector тащит или нужна отдельная векторная БД для RAG?

Сообщение pixeldns752 »

А есть смысл это делать в проде или только для локалки подходит?
👍 ❤️ 🔥 😄 🤔1
Ответить
Поделиться темой: ✈ Telegram VK

Кто сейчас на конференции

Сейчас этот форум просматривают: нет зарегистрированных пользователей и 1 гость