Flux на 8 гигах VRAM — OOM ровно на VAE decode, у всех так?
Рейтинг: 39.7% · 10 голосов
Войдите, чтобы голосовать
Голосовать «За» и «Против» могут только авторизованные пользователи. Войдите в свой аккаунт — или зарегистрируйтесь, это займёт минуту.
Нет аккаунта? Зарегистрироваться
- bytepy1399
- Сообщения: 5
- Зарегистрирован: Вт май 12, 2026 3:14 am
✔ Лучший ответ сформирован автоматически — valera9507
Классика на RTX 3070. Лечится флагом --lowvram или --medvram в WebUI, но в ComfyUI конкретно под Flux нужно поставить VAEDecode через tiled_vae — нода называется VAEDecodeTiled, тайл 512 или 256. Семплинг работает нормально потому что он в fp8/fp16, а VAE по умолчанию грузится в fp32 и жрёт ещё лишние ~3 ГБ. Добавь в начало воркфлоу ноду Load VAE и загрузи ae.safetensors явно с precision float16 …
- flowgo4491
- Сообщения: 12
- Зарегистрирован: Вс май 10, 2026 8:32 pm
- valera9507
- Сообщения: 8
- Зарегистрирован: Ср май 13, 2026 10:29 pm
Re: Flux на 8 гигах VRAM — OOM ровно на VAE decode, у всех так?
✔ Лучший ответ — сформирован автоматически
Классика на RTX 3070. Лечится флагом --lowvram или --medvram в WebUI, но в ComfyUI конкретно под Flux нужно поставить VAEDecode через tiled_vae — нода называется VAEDecodeTiled, тайл 512 или 256. Семплинг работает нормально потому что он в fp8/fp16, а VAE по умолчанию грузится в fp32 и жрёт ещё лишние ~3 ГБ. Добавь в начало воркфлоу ноду Load VAE и загрузи ae.safetensors явно с precision float16 — OOM на декоде пропадёт.
Re: Flux на 8 гигах VRAM — OOM ровно на VAE decode, у всех так?
Если не хочется возиться с tiled decode, есть радикальное решение: перегрузить VAE на CPU через ноду VAE Loader с override на cpu. Да, декод займёт 10-15 секунд вместо 1, но не крашится совсем. На 3070 я так и оставил — всё равно узкое место не декод а семплинг, итоговое время на картинку растёт несущественно. Flux fp8 checkpoint ещё освобождает ~2 ГБ по сравнению с fp16 версией, тоже вариант.
- gleb_dns92
- Сообщения: 11
- Зарегистрирован: Пн май 11, 2026 9:38 pm
Re: Flux на 8 гигах VRAM — OOM ровно на VAE decode, у всех так?
Ещё один угол: проверь что у тебя включён pytorch 2.x с torch.compile и xformers. На 8 ГБ без xformers attention жрёт несравнимо больше памяти. И обязательно --disable-nan-check если используешь A1111 форк — он держит лишний буфер в памяти для дебага. Но если совсем упирается — rtx 3070 это 8 ГБ GDDR6 без поддержки fp8 через tensor cores, поэтому реальный потолок разрешения без тайлинга примерно 768x768 под Flux.
Поделиться темой:
✈ Telegram
VK
- Похожие темы
-
-
-
-
- Flux всем подряд лепит ямочку на подбородке и пластиковую кожу — есть лечение?
7 ответов · 329 просмотров
-
- LoRA для Flux — почему тренировка выходит мыльной, хотя датасет нормальный?
6 ответов · 11 просмотров
-
- Flux.1 Kontext vs img2img в SD — реально ли он заменяет inpaint и редактирование?
6 ответов · 11 просмотров
Кто сейчас на конференции
Сейчас этот форум просматривают: нет зарегистрированных пользователей и 0 гостей