LoRA на 15 фоток пережаривается — кручу dim/alpha, всё равно вылезает один и тот же кадр

Теги: #LoRA
Рейтинг: 51.2% · 19 голосов
Генеративный AI для картинок и видео: Stable Diffusion, Midjourney, Flux, Sora, ComfyUI, LoRA, ControlNet, промпт-инжиниринг и творческие пайплайны.
Ответить
Аватара пользователя
blueteam_olga
Сообщения: 3
Зарегистрирован: Пн май 18, 2026 10:20 pm

LoRA на 15 фоток пережаривается — кручу dim/alpha, всё равно вылезает один и тот же кадр

Сообщение blueteam_olga »

Тренирую LoRA на персонажа, датасет 15 фото. Через 8-10 эпох уже узнаваемо, но на любом промте лезет один и тот же ракурс и фон из трейна. Поднимаю/опускаю вес — либо клон датасета, либо не похоже вообще. Где золотая середина?
👍 ❤️ 🔥1 😄 🤔
✔ Лучший ответ сформирован автоматически — lev_io
Проблема скорее всего в некачественном датасете, а не в dim/alpha. 15 фото — это нормально, но если они все сняты в одной локации, с похожим освещением и под близким углом — сеть заучит именно фон и ракурс, а не персонажа. Базовый чеклист перед тренировкой: разнообразие фонов (хотя бы 4-5 разных), вариации освещения (студийное/уличное/контровой свет), разные ракурсы (фронт, 3/4, профиль), несколь…
Перейти к ответу →
Аватара пользователя
egor1580
Сообщения: 25
Зарегистрирован: Вс май 10, 2026 9:27 pm

Re: LoRA на 15 фоток пережаривается — кручу dim/alpha, всё равно вылезает один и тот же кадр

Сообщение egor1580 »

Классический оверфит на маленьком датасете. Первое: dim 128 для персонажа это перебор, бери dim 16 / alpha 8 или даже 8/4. Меньше параметров — меньше шансов вызубрить фон. Второе: учи меньше шагов, не до 'идеально', а до 'чуть-чуть не дотянул'.
👍 ❤️ 🔥 😄 🤔
Аватара пользователя
german_byte
Сообщения: 4
Зарегистрирован: Вт май 12, 2026 11:29 am

Re: LoRA на 15 фоток пережаривается — кручу dim/alpha, всё равно вылезает один и тот же кадр

Сообщение german_byte »

Вот про капшены я и не подумал, у меня там тупо 'sks woman' на всех. То есть надо детально расписывать каждое фото включая 'red dress, kitchen background'?
👍 ❤️ 🔥 😄 🤔
Аватара пользователя
dockerssh2428
Сообщения: 20
Зарегистрирован: Вт май 12, 2026 9:04 am

Re: LoRA на 15 фоток пережаривается — кручу dim/alpha, всё равно вылезает один и тот же кадр

Сообщение dockerssh2428 »

И сохраняй чекпоинты каждые 2 эпохи, потом сделай xyz-сетку по ним. Почти всегда лучший — не последний, а где-то посередине. Последний уже пережарен. У меня на портретах обычно эпоха 6 из 12 идеальная.
👍2 ❤️1 🔥 😄 🤔
Аватара пользователя
elena_msk
Сообщения: 22
Зарегистрирован: Вс май 10, 2026 9:25 pm

Re: LoRA на 15 фоток пережаривается — кручу dim/alpha, всё равно вылезает один и тот же кадр

Сообщение elena_msk »

Перетренил с dim 16/alpha 8, расписал капшены, взял чекпоинт с эпохи 6 — небо и земля. Теперь меняется одежда и фон, а лицо держится. Фон из кухни больше не телепортируется в каждый кадр. Спасибо, тема закрыта.
👍1 ❤️ 🔥 😄1 🤔1
Аватара пользователя
lev_io
Сообщения: 9
Зарегистрирован: Вс май 10, 2026 8:21 pm

Re: LoRA на 15 фоток пережаривается — кручу dim/alpha, всё равно вылезает один и тот же кадр

Сообщение lev_io »

✔ Лучший ответ — сформирован автоматически
Проблема скорее всего в некачественном датасете, а не в dim/alpha. 15 фото — это нормально, но если они все сняты в одной локации, с похожим освещением и под близким углом — сеть заучит именно фон и ракурс, а не персонажа. Базовый чеклист перед тренировкой: разнообразие фонов (хотя бы 4-5 разных), вариации освещения (студийное/уличное/контровой свет), разные ракурсы (фронт, 3/4, профиль), несколько дистанций. Даже 10 грамотно подобранных фото дадут лучший результат чем 15 однотипных.
👍1 ❤️ 🔥1 😄2 🤔
Аватара пользователя
misha_crypto60
Сообщения: 2
Зарегистрирован: Вс май 17, 2026 1:17 am

Re: LoRA на 15 фоток пережаривается — кручу dim/alpha, всё равно вылезает один и тот же кадр

Сообщение misha_crypto60 »

Конкретные цифры которые у меня работают под kohya_ss на Flux-LoRA: rank 16-32, alpha = rank/2, learning rate 1e-4 для сети и 5e-5 для text encoder, 10-15 эпох, batch size 1 с gradient accumulation 4. Важно включить noise_offset около 0.05-0.1 — это сильно помогает с разнообразием генерации и убирает залипание на конкретной позе. И caption каждое фото руками, не автоматом — автокептшн WD14 часто описывает фон вместо персонажа, и это вшивается в триггер.
👍 ❤️ 🔥 😄 🤔
Ответить
Поделиться темой: ✈ Telegram VK

Вернуться в «Нейрогенерация: изображения и видео»

Кто сейчас на конференции

Сейчас этот форум просматривают: нет зарегистрированных пользователей и 1 гость