RTX 3090

Старая флагманская карта Ampere с 24 ГБ на борту неожиданно стала народным выбором под локальные LLM: за 55-60к на вторичке это лучший рубль за гигабайт VRAM в 2026. Тут считают, брать вторую 3090 или копить на 5090, ловят падение до 7 t/s в llama.cpp вместо честных 25+, спорят про энергопотребление и риски б/у майнинговых экземпляров. Сравнивают экономику домашнего рига против аренды в облаке и тестируют, влезет ли gpt-oss-120b в одну карту. Собираешь инференс дома и не хочешь переплачивать за RTX 40/50 - тебе сюда.

5 тем, 28 ответов, 29 просмотров · все теги

Похожие теги: llama.cpp 3LLM 1видеокарта 1Авито 1железо 1MoE 1производительность 1локально vs облако 1аренда gpu 1экономика 1локальный-инференс 1gpt-oss 1