RAG на проде галлюцинирует и тащит не те документы, что чинить в первую очередь
Рейтинг: 43.9% · 3 голосов
Войдите, чтобы голосовать
Голосовать «За» и «Против» могут только авторизованные пользователи. Войдите в свой аккаунт — или зарегистрируйтесь, это займёт минуту.
Нет аккаунта? Зарегистрироваться
- envoylover
- Сообщения: 3
- Зарегистрирован: 08 июн 2026, 15:58
RAG на проде галлюцинирует и тащит не те документы, что чинить в первую очередь
Подняли RAG ассистента по внутренней базе регламентов, в демке всё красиво, на проде юзеры жалуются что отвечает уверенно но мимо, цитирует не тот документ или вообще выдумывает пункт которого нет. Стек: эмбеддинги e5-large, qdrant, top_k=5, llm генерит ответ по найденному. Куда копать сначала, в ретривер или в промпт генерации. Чувствую что проблема в поиске но не могу доказать.
✔ Лучший ответ сформирован автоматически — docker13
Manuelriere писал(а):сам финальный ответ как мерять без ручной разметки llm as judge, но осторожно. берёшь второй моделью промпт типа подтверждается ли ответ приведённым контекстом, faithfulness по сути. ragas это умеет из коробки, faithfulness и answer_relevancy. не идеально, джадж сам шумит, но как онлайн метрика на тренде гораздо лучше чем глазами раз в неделю. калибруй джаджа на своей ручной …
Re: RAG на проде галлюцинирует и тащит не те документы, что чинить в первую очередь
сначала измерь ретривер отдельно от генерации. без этого вы гадаете. собери 50-100 реальных вопросов, разметь руками какой чанк правильный, посчитай recall@5 и hit rate. если правильный чанк не попадает в топ5, llm физически не сможет ответить и будет галлюцинировать. лечится это не промптом.
Re: RAG на проде галлюцинирует и тащит не те документы, что чинить в первую очередь
вот это скорее всего и есть корень. для регламентов фиксированное окно убивает структуру, пункт 4.2.1 уезжает в один чанк, его условие в другой. режьте по структуре документа, по заголовкам и пунктам, с оверлапом. у нас recall подскочил с 0.61 до 0.84 только от смены чанкинга, ничего больше не трогали.kardanger писал(а):резали по 512 токенов в лоб по символам
- Manuelriere
- Сообщения: 58
- Зарегистрирован: 13 май 2026, 17:46
Re: RAG на проде галлюцинирует и тащит не те документы, что чинить в первую очередь
✔ Лучший ответ — сформирован автоматически
llm as judge, но осторожно. берёшь второй моделью промпт типа подтверждается ли ответ приведённым контекстом, faithfulness по сути. ragas это умеет из коробки, faithfulness и answer_relevancy. не идеально, джадж сам шумит, но как онлайн метрика на тренде гораздо лучше чем глазами раз в неделю. калибруй джаджа на своей ручной разметке хотя бы раз чтоб понимать его смещение.Manuelriere писал(а):сам финальный ответ как мерять без ручной разметки
Re: RAG на проде галлюцинирует и тащит не те документы, что чинить в первую очередь
по факту порядок такой: 1) почини чанкинг по структуре. 2) добавь префиксы e5. 3) top_k 20 плюс reranker до 5. 4) только потом крути промпт генерации с явной инструкцией отвечай только по контексту, не знаешь так и скажи. промпт последний потому что он не вытащит то чего нет в найденном. и да, добавь в ответ ссылки на источники с номером пункта, юзеры сами увидят когда модель сослалась не туда, это лучший детектор галлюцинаций на early этапе.
Поделиться темой:
✈ Telegram
VK
- Похожие темы
-
-
-
-
- GitHub лежал почти весь день, Actions потеряли очередь джобов. Как пережили?
7 ответов · 5 просмотров
-
- RAG галлюцинирует на длинном контексте хотя нужный чанк в выдаче ретривера есть
6 ответов · 2 просмотров
Кто сейчас на конференции
Сейчас этот форум просматривают: нет зарегистрированных пользователей и 1 гость