Файнтюнил Qwen на базе тикетов через QLoRA и получил лоботомита, разбор факапа
Рейтинг: 20.8% · 3 голосов
Войдите, чтобы голосовать
Голосовать «За» и «Против» могут только авторизованные пользователи. Войдите в свой аккаунт — или зарегистрируйтесь, это займёт минуту.
Нет аккаунта? Зарегистрироваться
- ansiblemain
- Сообщения: 4
- Зарегистрирован: 12 май 2026, 14:00
Файнтюнил Qwen на базе тикетов через QLoRA и получил лоботомита, разбор факапа
Хотел саппорт-бота на своих данных. Выгрузил 12 тысяч тикетов из хелпдеска, почистил, собрал пары вопрос-ответ. Qwen3.5-14B, QLoRA через unsloth на одной 3090, r=16, alpha=32, lr 2e-4, 3 эпохи. Лосс падал красиво, я уже прикидывал, как премию просить.
На выходе: модель идеально скопировала стиль наших саппортов, вплоть до фирменного "ожидайте, заявка передана инженеру". Проблема в том, что она теперь отвечает так НА ВСЁ. Спрашиваю, сколько будет 2+2, отвечает, что заявка передана. Классический catastrophic forgetting, читал про него, думал, меня не коснётся.
Перезапустил с одной эпохой и lr 5e-5, лоботомия ушла, но фактам по продукту модель так и не научилась, путает версии и выдумывает несуществующие настройки. Похоже, мне с самого начала нужен был RAG, а не файнтюн. Кто-нибудь получал реальный профит от тюна на доменных данных или это у всех один и тот же грабельный маршрут?
На выходе: модель идеально скопировала стиль наших саппортов, вплоть до фирменного "ожидайте, заявка передана инженеру". Проблема в том, что она теперь отвечает так НА ВСЁ. Спрашиваю, сколько будет 2+2, отвечает, что заявка передана. Классический catastrophic forgetting, читал про него, думал, меня не коснётся.
Перезапустил с одной эпохой и lr 5e-5, лоботомия ушла, но фактам по продукту модель так и не научилась, путает версии и выдумывает несуществующие настройки. Похоже, мне с самого начала нужен был RAG, а не файнтюн. Кто-нибудь получал реальный профит от тюна на доменных данных или это у всех один и тот же грабельный маршрут?
✔ Лучший ответ сформирован автоматически — davkar
ansiblemain писал(а):Похоже, мне с самого начала нужен был RAG, а не файнтюн с оговоркой. чистый RAG поверх базовой модели отвечает правильно, но казённо, и юзеры это чувствуют. у нас в проде гибрид: 8B затюнена только на стиль и структуру ответа (около 3к примеров, одна эпоха), а факты тянет ретривер, bge-m3 плюс qdrant. связка бьёт голую 32B без тюна и по качеству, и по скорости. так что свой ф…
- coder_vlad
- Сообщения: 72
- Зарегистрирован: 11 май 2026, 01:57
Re: Файнтюнил Qwen на базе тикетов через QLoRA и получил лоботомита, разбор факапа
Датасет у тебя и есть проблема. 12к однотипных пар, модель выучила формат и забила на всё остальное. Стандартное лечение: подмешать процентов 30-40 общих инструкций (saiga-датасеты, alpaca-ru, что угодно generic), тогда стиль выучится, а мозги останутся. lr 2e-4 для 14B многовато, я бы 1e-4 потолком ставил. Ну и факты файнтюном не вбивают, тюн это про тон и формат. Старая мантра, но все хотят проверить на себе.
Re: Файнтюнил Qwen на базе тикетов через QLoRA и получил лоботомита, разбор факапа
✔ Лучший ответ — сформирован автоматически
с оговоркой. чистый RAG поверх базовой модели отвечает правильно, но казённо, и юзеры это чувствуют. у нас в проде гибрид: 8B затюнена только на стиль и структуру ответа (около 3к примеров, одна эпоха), а факты тянет ретривер, bge-m3 плюс qdrant. связка бьёт голую 32B без тюна и по качеству, и по скорости. так что свой файнтюн не выкидывай, просто убери из него факты и оставь манеруansiblemain писал(а):Похоже, мне с самого начала нужен был RAG, а не файнтюн
Re: Файнтюнил Qwen на базе тикетов через QLoRA и получил лоботомита, разбор факапа
а безопасника ты спросил? в тикетах телефоны, инн, номера договоров. затюнишь, а потом модель выплюнет чужой номер случайному юзеру. у нас за такой эксперимент голову открутили бы ещё на этапе выгрузки из хелпдеска, и правильно сделали бы
Поделиться темой:
✈ Telegram
VK
- Похожие темы
-
- Qwen3.6 35B MoE на одной 24GB карте — у кого получилось нормально запустить?
7 ответов · 23 просмотров
-
- Отдали разметку 180к фоток подрядчику за 400к рублей и получили мусор, разбор факапа
7 ответов · 6 просмотров
-
- Зафайнтюнил Qwen3 14B на тикетах саппорта и получил лоботомита. Вскрытие фейла
9 ответов · 6 просмотров
-
- Зафайнтюнил Qwen2.5-7B на тикетах саппорта, получил лоботомита. где я облажался
6 ответов · 3 просмотров
-
- Запустил 3 Claude Code параллельно в worktree и получил кашу из конфликтов. Где я туплю?
4 ответов · 2 просмотров
-
- QLoRA на 40к саппорт-тикетов: месяц работы, модель отупела. Где я облажался?
7 ответов · 2 просмотров
Кто сейчас на конференции
Сейчас этот форум просматривают: нет зарегистрированных пользователей и 1 гость