LoRA vs полный файнтюн в 2026 — кто-нибудь реально видит разницу в качестве?

Теги: #LoRA#Qwen
Рейтинг: 64% · 16 голосов
Machine learning и deep learning: обучение и дообучение моделей, датасеты, PyTorch, TensorFlow, эксперименты, метрики, MLOps и аналитика данных.
Ответить
Аватара пользователя
kirill_backend
Сообщения: 33
Зарегистрирован: Сб май 16, 2026 5:24 pm

LoRA vs полный файнтюн в 2026 — кто-нибудь реально видит разницу в качестве?

Сообщение kirill_backend »

Дообучаю Qwen2.5-7B на своём датасете инструкций (~40k примеров). Раньше делал full fine-tune, но память кончается даже на A100 80GB с длинным контекстом. Стоит ли переходить на LoRA/QLoRA или потеряю в качестве на доменных задачах?
👍6 ❤️ 🔥2 😄1 🤔3
Аватара пользователя
stacksql1977
Сообщения: 15
Зарегистрирован: Пн май 11, 2026 2:25 am

Re: LoRA vs полный файнтюн в 2026 — кто-нибудь реально видит разницу в качестве?

Сообщение stacksql1977 »

На 40k примерах full FT почти всегда оверфитит, если домен узкий. LoRA с rank 32-64 у меня давала практически тот же результат на бенчах, а тренируется в 3 раза дешевле.
👍3 ❤️1 🔥2 😄 🤔
Аватара пользователя
semyon_null56
Сообщения: 32
Зарегистрирован: Пн май 11, 2026 12:44 am

Re: LoRA vs полный файнтюн в 2026 — кто-нибудь реально видит разницу в качестве?

Сообщение semyon_null56 »

Подтверждаю. QLoRA 4-bit на одной A100 спокойно тянет 7B с контекстом 4k. Главное alpha не задирать, ставь alpha = 2*rank как базу и дальше тюнь.
👍1 ❤️ 🔥1 😄 🤔
Аватара пользователя
proxyproxy8483
Сообщения: 1
Зарегистрирован: Ср май 13, 2026 3:52 pm

Re: LoRA vs полный файнтюн в 2026 — кто-нибудь реально видит разницу в качестве?

Сообщение proxyproxy8483 »

А кто-нибудь rsLoRA пробовал? Говорят на больших rank стабильнее, потому что скейлинг по sqrt(rank), а не по rank.
👍2 ❤️ 🔥 😄 🤔
Аватара пользователя
cachego9376
Сообщения: 22
Зарегистрирован: Вт май 12, 2026 2:46 pm

Re: LoRA vs полный файнтюн в 2026 — кто-нибудь реально видит разницу в качестве?

Сообщение cachego9376 »

rsLoRA включил флагом use_rslora=True в peft, на rank 128 действительно перестало взрываться. Спасибо, попробую.
👍 ❤️ 🔥2 😄1 🤔
Аватара пользователя
ksenia8901
Сообщения: 3
Зарегистрирован: Пт май 15, 2026 2:44 am

Re: LoRA vs полный файнтюн в 2026 — кто-нибудь реально видит разницу в качестве?

Сообщение ksenia8901 »

Не забывайте, что LoRA сильно зависит от того, какие модули таргетите. Только q_proj/v_proj это вчерашний день, накидывайте все линейные слои включая gate/up/down, разница заметная.
👍3 ❤️1 🔥 😄1 🤔2
Аватара пользователя
cloudml9635
Сообщения: 6
Зарегистрирован: Ср май 20, 2026 6:19 am

Re: LoRA vs полный файнтюн в 2026 — кто-нибудь реально видит разницу в качестве?

Сообщение cloudml9635 »

Плюс к этому. target_modules=all-linear в новых версиях peft делает это автоматом. На MMLU-доменном у меня +1.8 пункта только от этого.
👍2 ❤️2 🔥5 😄 🤔1
Аватара пользователя
filipp8696
Сообщения: 3
Зарегистрирован: Пн май 11, 2026 6:56 pm

Re: LoRA vs полный файнтюн в 2026 — кто-нибудь реально видит разницу в качестве?

Сообщение filipp8696 »

А full FT хоть в каком случае ещё имеет смысл? Или это полностью legacy?
👍 ❤️ 🔥 😄 🤔
Аватара пользователя
german_byte
Сообщения: 4
Зарегистрирован: Вт май 12, 2026 11:29 am

Re: LoRA vs полный файнтюн в 2026 — кто-нибудь реально видит разницу в качестве?

Сообщение german_byte »

Если меняешь поведение модели глобально (новый язык, новый формат рассуждений) full FT всё ещё лучше. Для доменной адаптации LoRA выигрывает по цене/качеству, согласен с тредом.
👍1 ❤️ 🔥 😄 🤔
Ответить
Поделиться темой: ✈ Telegram VK

Вернуться в «Машинное обучение и Data Science»

Кто сейчас на конференции

Сейчас этот форум просматривают: нет зарегистрированных пользователей и 1 гость