Файнтюн или RAG для базы знаний, спорим уже неделю в команде

Рейтинг: 20.7% · 1 голосов
Machine learning и deep learning: обучение и дообучение моделей, датасеты, PyTorch, TensorFlow, эксперименты, метрики, MLOps и аналитика данных.
Ответить
Аватара пользователя
alansmit
Сообщения: 84
Зарегистрирован: 13 май 2026, 00:35

Файнтюн или RAG для базы знаний, спорим уже неделю в команде

Сообщение alansmit »

Холивар у нас в команде на ровном месте. Половина хочет файнтюнить Qwen2.5 на нашей документации чтобы модель знала продукт, вторая половина орёт что это бред и нужен только RAG. Бюджет на 4090 или аренду A100 в Селектеле есть. Кто прав? Задача чтобы саппорт-бот точно отвечал по нашим 8к страниц доков, которые ещё и меняются раз в неделю.
👍1 ❤️1 🔥1 😄 🤔
✔ Лучший ответ сформирован автоматически — RabbitNerd
Вот это правильное разделение, распишу потому что спор реально вечный и обе стороны частично правы. Правило простое. RAG это про знание что, файнтюн это про поведение как. Факты, цифры, актуальные процедуры, всё что меняется, только RAG. Дёшево обновлять, переиндексировал базу и готово, никакого переобучения. Для вашего кейса с еженедельными изменениями доков это безусловная основа. Файнтюн имеет…
Перейти к ответу →
Аватара пользователя
wasmnerd
Сообщения: 22
Зарегистрирован: 20 май 2026, 17:36

Re: Файнтюн или RAG для базы знаний, спорим уже неделю в команде

Сообщение wasmnerd »

доки меняются раз в неделю и вы хотите файнтюнить? переобучать модель каждую неделю на 8к страниц? вы серьёзно? RAG, тема закрыта
👍 ❤️ 🔥1 😄 🤔1
Аватара пользователя
fpga_lord
Сообщения: 56
Зарегистрирован: 16 май 2026, 06:00

Re: Файнтюн или RAG для базы знаний, спорим уже неделю в команде

Сообщение fpga_lord »

wasmnerd писал(а):доки меняются раз в неделю и вы хотите файнтюнить?
плюсую, это решающий аргумент. файнтюн запекает знание в веса на момент обучения. поменялась цена в доке, всё, модель уверенно врёт старую и даже не знает что устарела. RAG достаёт актуальный документ в рантайме. для часто меняющихся фактов файнтюн это закладка мины
👍2 ❤️ 🔥 😄1 🤔
Аватара пользователя
marianna
Сообщения: 70
Зарегистрирован: 11 май 2026, 11:23

Re: Файнтюн или RAG для базы знаний, спорим уже неделю в команде

Сообщение marianna »

вы оба путаете что чему учит. файнтюн не для фактов, факты в RAG. файнтюн для стиля, формата ответа, тона, для доменной лексики и для того чтобы модель перестала лить воду и отвечала как ваш саппорт. это ортогональные штуки а не или-или
👍 ❤️ 🔥 😄 🤔
Аватара пользователя
RabbitNerd
Сообщения: 11
Зарегистрирован: 25 май 2026, 05:20

Re: Файнтюн или RAG для базы знаний, спорим уже неделю в команде

Сообщение RabbitNerd »

✔ Лучший ответ — сформирован автоматически
Вот это правильное разделение, распишу потому что спор реально вечный и обе стороны частично правы.

Правило простое. RAG это про знание что, файнтюн это про поведение как.

Факты, цифры, актуальные процедуры, всё что меняется, только RAG. Дёшево обновлять, переиндексировал базу и готово, никакого переобучения. Для вашего кейса с еженедельными изменениями доков это безусловная основа.

Файнтюн имеет смысл поверх, когда базовая модель плохо держит ваш формат. Скажем нужно чтобы бот всегда отвечал по структуре проблема-причина-решение, использовал ваши внутренние термины правильно, не извинялся по десять раз и не лил маркетинг. На голом промпте это шатко, LoRA на паре тысяч хороших примеров диалогов саппорта стабилизирует поведение. Дообучать раз в квартал, не еженедельно.

Экономика. LoRA на Qwen2.5-7B влезает в одну 4090 за ночь, не нужна A100. Аренда A100 в Селектеле порядка 150-200 рублей в час, для дообучения 7B это лишнее, для 32B да. Но прежде чем тратить хоть рубль на файнтюн, выжмите RAG до предела, нормальный реранкер и чанкинг, и хороший системный промпт. В 80 процентах случаев после этого файнтюн оказывается не нужен вообще. Начните с RAG, измерьте качество, и только если упираетесь именно в формат и тон, добавляйте LoRA. Не наоборот.
👍 ❤️1 🔥 😄 🤔1
Аватара пользователя
burnedsegfault
Сообщения: 2
Зарегистрирован: 05 июн 2026, 09:03

Re: Файнтюн или RAG для базы знаний, спорим уже неделю в команде

Сообщение burnedsegfault »

RabbitNerd писал(а):LoRA на Qwen2.5-7B влезает в одну 4090 за ночь
с qlora и в 24гб 14B можно впихнуть если батч 1 и градиент чекпоинтинг. но за ночь это оптимистично, у меня 7B на 5к примерах часа 4 на 4090 шло, 14B всю ночь и впритык по памяти
👍 ❤️1 🔥2 😄 🤔
Аватара пользователя
enjoyer_borya
Сообщения: 3
Зарегистрирован: 15 май 2026, 02:57

Re: Файнтюн или RAG для базы знаний, спорим уже неделю в команде

Сообщение enjoyer_borya »

ну вот пока вы тут теории разводите неделю, можно было уже RAG поднять и тикеты закрывать. меньше споров больше qdrant
👍1 ❤️1 🔥 😄 🤔
Ответить
Поделиться темой: ✈ Telegram VK

Вернуться в «Машинное обучение и Data Science»

Кто сейчас на конференции

Сейчас этот форум просматривают: нет зарегистрированных пользователей и 1 гость