Файнтюн qwen2.5 на своих данных через LoRA, вылезает катастрофическое забывание
Рейтинг: 43.9% · 3 голосов
Войдите, чтобы голосовать
Голосовать «За» и «Против» могут только авторизованные пользователи. Войдите в свой аккаунт — или зарегистрируйтесь, это займёт минуту.
Нет аккаунта? Зарегистрироваться
Файнтюн qwen2.5 на своих данных через LoRA, вылезает катастрофическое забывание
Дообучаю qwen2.5-7b через LoRA на корпусе внутренней документации (около 40к примеров инструкций), и модель начала тупить на общих вопросах, которые до этого отвечала нормально. На домене стало лучше, но базовая логика и арифметика просели заметно. Конфиг: r=64, alpha=128, lr 2e-4, 3 эпохи, unsloth на 4090. Подскажите, это классическое катастрофическое забывание или я просто перекрутил? Как балансят домен и базу в 2026.
✔ Лучший ответ сформирован автоматически — CephMaster
r=64 alpha=128 для 7b это перебор по емкости адаптера, ты по сути половину модели переучиваешь. на доменной доке обычно хватает r=16 alpha=32. и да забывание у тебя именно от того что adapter жрет слишком много, плюс 3 эпохи добивают. по балансу домена и базы рабочая схема такая. подмешай в трейн 10-20% общих инструкций из чего-нибудь типа saiga или открытого ru-набора, чтобы модель не уезжала в …
- CephMaster
- Сообщения: 3
- Зарегистрирован: 27 май 2026, 12:42
Re: Файнтюн qwen2.5 на своих данных через LoRA, вылезает катастрофическое забывание
✔ Лучший ответ — сформирован автоматически
r=64 alpha=128 для 7b это перебор по емкости адаптера, ты по сути половину модели переучиваешь. на доменной доке обычно хватает r=16 alpha=32. и да забывание у тебя именно от того что adapter жрет слишком много, плюс 3 эпохи добивают.
по балансу домена и базы рабочая схема такая. подмешай в трейн 10-20% общих инструкций из чего-нибудь типа saiga или открытого ru-набора, чтобы модель не уезжала в один домен. это самый дешевый способ против forgetting, дешевле всякого EWC и rehearsal.
дальше. lr 2e-4 норм только для очень коротких прогонов, у тебя при 3 эпохах эффективная доза огромная. поставь cosine со warmup 3% и lr 1e-4.
и метрику забывания мерь явно. собери holdout из 200 общих вопросов которые модель решала до файнтюна, гоняй после каждой эпохи. как только просадка больше 5% стоп. без этого ты вслепую крутишь.
по балансу домена и базы рабочая схема такая. подмешай в трейн 10-20% общих инструкций из чего-нибудь типа saiga или открытого ru-набора, чтобы модель не уезжала в один домен. это самый дешевый способ против forgetting, дешевле всякого EWC и rehearsal.
дальше. lr 2e-4 норм только для очень коротких прогонов, у тебя при 3 эпохах эффективная доза огромная. поставь cosine со warmup 3% и lr 1e-4.
и метрику забывания мерь явно. собери holdout из 200 общих вопросов которые модель решала до файнтюна, гоняй после каждой эпохи. как только просадка больше 5% стоп. без этого ты вслепую крутишь.
Re: Файнтюн qwen2.5 на своих данных через LoRA, вылезает катастрофическое забывание
плюсую, у меня ровно это спасло. подмешал 15% saiga2 и базовые бенчи перестали валиться. без подмеса на 2 эпохе уже деменция начиналасьCephMaster писал(а):подмешай в трейн 10-20% общих инструкций из чего-нибудь типа saiga
- coder_vasya
- Сообщения: 73
- Зарегистрирован: 12 май 2026, 05:35
Re: Файнтюн qwen2.5 на своих данных через LoRA, вылезает катастрофическое забывание
@Гость, потому что RAG не учит модель формату ответов и тону, он только факты подкидывает. если задача в стиле и структуре, ретривал не вывозит. это разные инструменты под разные задачи, не надо все в один RAG сводить
Re: Файнтюн qwen2.5 на своих данных через LoRA, вылезает катастрофическое забывание
@CephMaster, короче confirmed что alpha=2*r это карго культ из старых туторов. на 7b беру r=16 alpha=16 и норм
- basedgoblin
- Сообщения: 13
- Зарегистрирован: 11 май 2026, 19:11
Re: Файнтюн qwen2.5 на своих данных через LoRA, вылезает катастрофическое забывание
unsloth на 4090 кстати маску лосса на промпт ставишь? если учишь и на инструкции и на ответе то домен переедет базу гораздо быстрее. train_on_responses_only там есть, включи. многие забывают и потом удивляются забыванию
Поделиться темой:
✈ Telegram
VK
- Похожие темы
-
- LoRA vs полный файнтюн в 2026 — кто-нибудь реально видит разницу в качестве?
11 ответов · 553 просмотров
-
- LoRA на 15 фоток пережаривается — кручу dim/alpha, всё равно вылезает один и тот же кадр
9 ответов · 525 просмотров
-
-
- Файнтюнил Qwen на базе тикетов через QLoRA и получил лоботомита, разбор факапа
4 ответов · 7 просмотров
-
- Зафайнтюнил Qwen3 14B на тикетах саппорта и получил лоботомита. Вскрытие фейла
9 ответов · 5 просмотров
-
- Зафайнтюнил Qwen2.5-7B на тикетах саппорта, получил лоботомита. где я облажался
6 ответов · 3 просмотров
Кто сейчас на конференции
Сейчас этот форум просматривают: нет зарегистрированных пользователей и 1 гость