Файнтюнил Qwen на базе тикетов через QLoRA и получил лоботомита, разбор факапа

Рейтинг: 20.8% · 3 голосов
Запуск больших языковых моделей локально: Llama, Mistral, Qwen, DeepSeek, Gemma. Квантизация GGUF, Ollama, llama.cpp, vLLM, LM Studio, выбор GPU и оптимизация инференса.
Ответить
Аватара пользователя
ansiblemain
Сообщения: 4
Зарегистрирован: 12 май 2026, 14:00

Файнтюнил Qwen на базе тикетов через QLoRA и получил лоботомита, разбор факапа

Сообщение ansiblemain »

Хотел саппорт-бота на своих данных. Выгрузил 12 тысяч тикетов из хелпдеска, почистил, собрал пары вопрос-ответ. Qwen3.5-14B, QLoRA через unsloth на одной 3090, r=16, alpha=32, lr 2e-4, 3 эпохи. Лосс падал красиво, я уже прикидывал, как премию просить.
На выходе: модель идеально скопировала стиль наших саппортов, вплоть до фирменного "ожидайте, заявка передана инженеру". Проблема в том, что она теперь отвечает так НА ВСЁ. Спрашиваю, сколько будет 2+2, отвечает, что заявка передана. Классический catastrophic forgetting, читал про него, думал, меня не коснётся.
Перезапустил с одной эпохой и lr 5e-5, лоботомия ушла, но фактам по продукту модель так и не научилась, путает версии и выдумывает несуществующие настройки. Похоже, мне с самого начала нужен был RAG, а не файнтюн. Кто-нибудь получал реальный профит от тюна на доменных данных или это у всех один и тот же грабельный маршрут?
👍 ❤️ 🔥1 😄 🤔1
✔ Лучший ответ сформирован автоматически — davkar
ansiblemain писал(а):Похоже, мне с самого начала нужен был RAG, а не файнтюн с оговоркой. чистый RAG поверх базовой модели отвечает правильно, но казённо, и юзеры это чувствуют. у нас в проде гибрид: 8B затюнена только на стиль и структуру ответа (около 3к примеров, одна эпоха), а факты тянет ретривер, bge-m3 плюс qdrant. связка бьёт голую 32B без тюна и по качеству, и по скорости. так что свой ф…
Перейти к ответу →
Аватара пользователя
coder_vlad
Сообщения: 72
Зарегистрирован: 11 май 2026, 01:57

Re: Файнтюнил Qwen на базе тикетов через QLoRA и получил лоботомита, разбор факапа

Сообщение coder_vlad »

обряд инициации, все через лоботомита проходят. мой первый тюн на 7B отвечал на любой вопрос рецептом борща, потому что в датасет затесалась пачка кулинарки с форума. до сих пор ржу
👍 ❤️ 🔥1 😄 🤔
Аватара пользователя
kube22
Сообщения: 14
Зарегистрирован: 13 май 2026, 07:44

Re: Файнтюнил Qwen на базе тикетов через QLoRA и получил лоботомита, разбор факапа

Сообщение kube22 »

Датасет у тебя и есть проблема. 12к однотипных пар, модель выучила формат и забила на всё остальное. Стандартное лечение: подмешать процентов 30-40 общих инструкций (saiga-датасеты, alpaca-ru, что угодно generic), тогда стиль выучится, а мозги останутся. lr 2e-4 для 14B многовато, я бы 1e-4 потолком ставил. Ну и факты файнтюном не вбивают, тюн это про тон и формат. Старая мантра, но все хотят проверить на себе.
👍1 ❤️2 🔥1 😄 🤔
Аватара пользователя
davkar
Сообщения: 58
Зарегистрирован: 11 май 2026, 03:00

Re: Файнтюнил Qwen на базе тикетов через QLoRA и получил лоботомита, разбор факапа

Сообщение davkar »

✔ Лучший ответ — сформирован автоматически
ansiblemain писал(а):Похоже, мне с самого начала нужен был RAG, а не файнтюн
с оговоркой. чистый RAG поверх базовой модели отвечает правильно, но казённо, и юзеры это чувствуют. у нас в проде гибрид: 8B затюнена только на стиль и структуру ответа (около 3к примеров, одна эпоха), а факты тянет ретривер, bge-m3 плюс qdrant. связка бьёт голую 32B без тюна и по качеству, и по скорости. так что свой файнтюн не выкидывай, просто убери из него факты и оставь манеру
👍1 ❤️1 🔥 😄 🤔
Аватара пользователя
rdnckavn
Сообщения: 23
Зарегистрирован: 13 май 2026, 21:19

Re: Файнтюнил Qwen на базе тикетов через QLoRA и получил лоботомита, разбор факапа

Сообщение rdnckavn »

а безопасника ты спросил? в тикетах телефоны, инн, номера договоров. затюнишь, а потом модель выплюнет чужой номер случайному юзеру. у нас за такой эксперимент голову открутили бы ещё на этапе выгрузки из хелпдеска, и правильно сделали бы
👍2 ❤️ 🔥1 😄 🤔
Ответить
Поделиться темой: ✈ Telegram VK

Вернуться в «Локальные LLM и open-source модели»

Кто сейчас на конференции

Сейчас этот форум просматривают: нет зарегистрированных пользователей и 1 гость