Flux на 8 гигах VRAM — OOM ровно на VAE decode, у всех так?

bytepy1399 · Ср май 20, 2026 3:07 am

3070 на 8 гигов. Семплинг проходит нормально, прогресс-бар добегает до конца, а потом краш на VAE decode, out of memory. Обидно до слёз — картинка же по сути готова. Что включить?

flowgo4491 · Ср май 20, 2026 3:09 am

Классика. Поставь в ComfyUI ноду VAE Decode (Tiled) вместо обычной, и запускай с флагом --lowvram. VAE у Flux прожорливый, тайлами он раскладывает по кускам и влезает в 8 гигов спокойно. Скорости почти не теряешь.

denis6377 · Ср май 20, 2026 4:22 am

Ещё возьми fp8 версию модели и t5 энкодер в fp8, а не fp16. На 8 гигах fp16 t5 один сжирает половину памяти. Связка fp8 + tiled vae + lowvram у меня на 2070 Super стабильно крутит 1024х1024.

fedor_tcp · Ср май 20, 2026 4:35 am

Tiled VAE + fp8 t5 решили. Ни одного OOM за вечер, даже апскейл прошёл. Спасибо, а то я уже на свап грешил.

valera9507 · Вс май 31, 2026 6:10 am

Классика на RTX 3070. Лечится флагом --lowvram или --medvram в WebUI, но в ComfyUI конкретно под Flux нужно поставить VAEDecode через tiled_vae — нода называется VAEDecodeTiled, тайл 512 или 256. Семплинг работает нормально потому что он в fp8/fp16, а VAE по умолчанию грузится в fp32 и жрёт ещё лишние ~3 ГБ. Добавь в начало воркфлоу ноду Load VAE и загрузи ae.safetensors явно с precision float16 — OOM на декоде пропадёт.

netml2559 · Вс май 31, 2026 6:29 am

Если не хочется возиться с tiled decode, есть радикальное решение: перегрузить VAE на CPU через ноду VAE Loader с override на cpu. Да, декод займёт 10-15 секунд вместо 1, но не крашится совсем. На 3070 я так и оставил — всё равно узкое место не декод а семплинг, итоговое время на картинку растёт несущественно. Flux fp8 checkpoint ещё освобождает ~2 ГБ по сравнению с fp16 версией, тоже вариант.

gleb_dns92 · Вс май 31, 2026 11:43 am

Ещё один угол: проверь что у тебя включён pytorch 2.x с torch.compile и xformers. На 8 ГБ без xformers attention жрёт несравнимо больше памяти. И обязательно --disable-nan-check если используешь A1111 форк — он держит лишний буфер в памяти для дебага. Но если совсем упирается — rtx 3070 это 8 ГБ GDDR6 без поддержки fp8 через tensor cores, поэтому реальный потолок разрешения без тайлинга примерно 768x768 под Flux.

Cyberlake

Flux на 8 гигах VRAM — OOM ровно на VAE decode, у всех так?

Flux на 8 гигах VRAM — OOM ровно на VAE decode, у всех так?

Re: Flux на 8 гигах VRAM — OOM ровно на VAE decode, у всех так?

Re: Flux на 8 гигах VRAM — OOM ровно на VAE decode, у всех так?

Re: Flux на 8 гигах VRAM — OOM ровно на VAE decode, у всех так?

Re: Flux на 8 гигах VRAM — OOM ровно на VAE decode, у всех так?

Re: Flux на 8 гигах VRAM — OOM ровно на VAE decode, у всех так?

Re: Flux на 8 гигах VRAM — OOM ровно на VAE decode, у всех так?

Кто сейчас на конференции