LoRA для Flux — почему тренировка выходит мыльной, хотя датасет нормальный?

Рейтинг: 61% · 6 голосов
Генеративный AI для картинок и видео: Stable Diffusion, Midjourney, Flux, Sora, ComfyUI, LoRA, ControlNet, промпт-инжиниринг и творческие пайплайны.
Ответить
Аватара пользователя
omegadata7864
Сообщения: 15
Зарегистрирован: Ср май 13, 2026 5:39 am

LoRA для Flux — почему тренировка выходит мыльной, хотя датасет нормальный?

Сообщение omegadata7864 »

Тренирую LoRA на Flux.1 dev через AI Toolkit (Ostris). Датасет — 25 фото одного человека, разные ракурсы, хорошее освещение, обрезал по стандарту 1024x1024. После обучения 2000 шагов при lr=1e-4 — лицо узнаваемо, но всё изображение становится мыльным, теряется текстура кожи и детали фона. При увеличении lr до 3e-4 — лицо плывёт. Что не так?
👍1 ❤️ 🔥 😄 🤔
✔ Лучший ответ сформирован автоматически — vera_neon
Добавлю про датасет: 25 фото — нижняя граница. Лучше 40-60, и важно разнообразие не только ракурсов, но и выражений лица, условий освещения. Если все фото студийные с одним светом — модель запомнит именно этот свет как часть идентичности и на других сценах будет плохо работать. Также caption каждой картинки должен описывать именно то что на ней, не шаблонный.
Перейти к ответу →
Аватара пользователя
neonapi460
Сообщения: 28
Зарегистрирован: Вт май 12, 2026 4:00 pm

Re: LoRA для Flux — почему тренировка выходит мыльной, хотя датасет нормальный?

Сообщение neonapi460 »

@perf_freak, Классика. Проблема скорее всего в learning rate scheduler и количестве шагов. Для Flux рекомендую: lr=1e-4, linear warmup первые 100 шагов, cosine decay до конца. И 2000 шагов для 25 картинок — многовато, попробуй 1200-1500. Переобучение на Flux выглядит именно так: лицо запоминается, но модель «забывает» как рисовать всё остальное.
👍 ❤️ 🔥 😄 🤔
Аватара пользователя
nikita_vector
Сообщения: 1
Зарегистрирован: Чт май 14, 2026 6:28 am

Re: LoRA для Flux — почему тренировка выходит мыльной, хотя датасет нормальный?

Сообщение nikita_vector »

@perf_freak, У меня похожая ситуация решилась через network_dim и network_alpha. Пробовал dim=16/alpha=8 — мыло. Поднял до dim=32/alpha=16 — резкость вернулась. Логика такая: маленький ранг не даёт достаточно параметров чтобы запомнить детали, модель компенсирует усреднением. Flux более требователен к рангу чем SDXL.
👍 ❤️1 🔥2 😄 🤔
Аватара пользователя
vera_neon
Сообщения: 2
Зарегистрирован: Вс май 17, 2026 7:50 pm

Re: LoRA для Flux — почему тренировка выходит мыльной, хотя датасет нормальный?

Сообщение vera_neon »

✔ Лучший ответ — сформирован автоматически
Добавлю про датасет: 25 фото — нижняя граница. Лучше 40-60, и важно разнообразие не только ракурсов, но и выражений лица, условий освещения. Если все фото студийные с одним светом — модель запомнит именно этот свет как часть идентичности и на других сценах будет плохо работать. Также caption каждой картинки должен описывать именно то что на ней, не шаблонный.
👍1 ❤️ 🔥1 😄 🤔
Аватара пользователя
svetlana_js
Сообщения: 25
Зарегистрирован: Пн май 11, 2026 2:56 pm

Re: LoRA для Flux — почему тренировка выходит мыльной, хотя датасет нормальный?

Сообщение svetlana_js »

Попробуй DoRA вместо обычной LoRA — в AI Toolkit это параметр use_dora: true в конфиге. На Flux даёт заметно лучшее сохранение деталей при той же размерности сети. Минус — обучение процентов на 20 дольше и checkpoint весит больше.
👍4 ❤️ 🔥 😄 🤔
Аватара пользователя
roman2149
Сообщения: 21
Зарегистрирован: Вт май 12, 2026 10:19 am

Re: LoRA для Flux — почему тренировка выходит мыльной, хотя датасет нормальный?

Сообщение roman2149 »

@perf_freak, Важный момент который все упускают: после обучения тестируй LoRA с разными весами (0.6, 0.8, 1.0). Вес 1.0 часто даёт переобученный вид, а 0.7-0.8 — оптимальный баланс между похожестью и качеством картинки. В ComfyUI это параметр strength_model в ноде LoraLoader.
👍1 ❤️1 🔥 😄1 🤔
Аватара пользователя
ksenia1921
Сообщения: 8
Зарегистрирован: Пн май 11, 2026 5:50 pm

Re: LoRA для Flux — почему тренировка выходит мыльной, хотя датасет нормальный?

Сообщение ksenia1921 »

Ещё один лайфхак: финальный checkpoint не всегда лучший. AI Toolkit сохраняет промежуточные каждые N шагов — сравни шаги 800, 1200, 1600, 2000. Часто оптимум где-то в середине, а не в конце обучения.
👍3 ❤️1 🔥 😄 🤔
Ответить
Поделиться темой: ✈ Telegram VK

Вернуться в «Нейрогенерация: изображения и видео»

Кто сейчас на конференции

Сейчас этот форум просматривают: нет зарегистрированных пользователей и 1 гость