Запорол лору на 800 фото из за кривого датасета, делитесь как вы чистите данные
Рейтинг: 37.6% · 5 голосов
Войдите, чтобы голосовать
Голосовать «За» и «Против» могут только авторизованные пользователи. Войдите в свой аккаунт — или зарегистрируйтесь, это займёт минуту.
Нет аккаунта? Зарегистрироваться
Запорол лору на 800 фото из за кривого датасета, делитесь как вы чистите данные
Слил три дня и 1500 рублей аренды на тренировку лоры, а результат мусор потому что датасет был грязный. Собрал 800 картинок персонажа, накидал теги автотеггером и пустил тренить на 4090. На выходе лора тащит в кадр случайный мусор: водяные знаки, рамки, какой то текст снизу, и стиль плавает потому что фото были из разных источников с разной обработкой. Понял что проблема в данных а не в настройках, но уже после того как спалил деньги. Как вы реально чистите датасет перед тренировкой, есть нормальный воркфлоу или все руками перебирают.
✔ Лучший ответ сформирован автоматически — torch22
Вот рабочий процесс чистки, выстрадал за пару лет тренировок. Первое и самое важное, отсмотреть руками каждое фото, да все, по другому никак, на 800 это вечер с сериалом на фоне. Выкидываешь все с водяными знаками, рамками, текстом, коллажи, мыло, кадры где персонаж мелкий или обрезан. Лучше 60 чистых чем 800 с мусором, модель учит ВСЕ что видит, включая логотип в углу. Второе, приводишь к едином…
Re: Запорол лору на 800 фото из за кривого датасета, делитесь как вы чистите данные
не всегда. для стиля или для персонажа в куче ракурсов 800 норм, если они чистые. проблема не в количестве а в том что он не отсмотрел. но согласен что на 50 идеальных проще выйти на результат и дешевле тренитьjbentley писал(а):800 фото для лоры персонажа это перебор
Re: Запорол лору на 800 фото из за кривого датасета, делитесь как вы чистите данные
✔ Лучший ответ — сформирован автоматически
Вот рабочий процесс чистки, выстрадал за пару лет тренировок. Первое и самое важное, отсмотреть руками каждое фото, да все, по другому никак, на 800 это вечер с сериалом на фоне. Выкидываешь все с водяными знаками, рамками, текстом, коллажи, мыло, кадры где персонаж мелкий или обрезан. Лучше 60 чистых чем 800 с мусором, модель учит ВСЕ что видит, включая логотип в углу. Второе, приводишь к единому виду: кропаешь под нужный аспект, апскейлишь мелкие если жалко выкидывать, но лучше выкинуть. Третье, теги. Автотеггер (wd-tagger) дает основу, но дальше руками: убираешь мусорные теги, и главное, добавляешь тег который НЕ хочешь чтобы лора выучила как постоянку. Звучит наоборот, но смысл такой: если на всех фото красная куртка и ты ее не затегал, лора вошьет куртку намертво. Затегал red jacket, теперь куртка отвязана и управляется промптом. То же с фоном, добавь simple background где он простой. Четвертое, перед полным прогоном гоняй тестовую тренировку на 10 эпохах и смотри превью, увидишь мусор сразу и не спалишь все деньги. И отзеркаленные дубли не добавляй, оверфитит. По деньгам: тестовый прогон на 30 минут аренды это рублей 30, дешевле чем твои 1500 в трубу.
- lorenzinoarq
- Сообщения: 65
- Зарегистрирован: 11 май 2026, 00:03
Re: Запорол лору на 800 фото из за кривого датасета, делитесь как вы чистите данные
вот это золото, до меня этот принцип месяца три доходил. что тегаешь то отвязываешь, что не тегаешь то прибивается гвоздями к персонажу. как понял так качество лор подскочило резкоsainty писал(а):если на всех фото красная куртка и ты ее не затегал, лора вошьет куртку намертво
Поделиться темой:
✈ Telegram
VK
- Похожие темы
-
- Cloudflare R2 vs AWS S3 — кто реально съехал из-за egress? Делитесь опытом
12 ответов · 743 просмотров
-
-
-
- Go 1.26 и Green Tea GC по умолчанию: собрал цифры с прода за неделю, делитесь своими
4 ответов · 7 просмотров
-
-
- ESP32-S3 + камера OV5640: потоковое видео на RTSP без зависаний — поделитесь рабочей конфигурацией
5 ответов · 4 просмотров
Кто сейчас на конференции
Сейчас этот форум просматривают: нет зарегистрированных пользователей и 1 гость