RTX 3090
Старая флагманская карта Ampere с 24 ГБ на борту неожиданно стала народным выбором под локальные LLM: за 55-60к на вторичке это лучший рубль за гигабайт VRAM в 2026. Тут считают, брать вторую 3090 или копить на 5090, ловят падение до 7 t/s в llama.cpp вместо честных 25+, спорят про энергопотребление и риски б/у майнинговых экземпляров. Сравнивают экономику домашнего рига против аренды в облаке и тестируют, влезет ли gpt-oss-120b в одну карту. Собираешь инференс дома и не хочешь переплачивать за RTX 40/50 - тебе сюда.
5 тем, 28 ответов, 29 просмотров · все теги
Похожие теги:
llama.cpp 3LLM 1видеокарта 1Авито 1железо 1MoE 1производительность 1локально vs облако 1аренда gpu 1экономика 1локальный-инференс 1gpt-oss 1
- Темы
-
- gpt-oss-120b на одной 3090 24гб реально гонять или фантазии?
в «Локальные LLM и open-source модели» · 5 ответов · 2 просмотров · 12 июн 2026, 06:57
-
- 7 t/s на 3090 в llama.cpp вместо 25+, помогите найти косяк
в «Локальные LLM и open-source модели» · 6 ответов · 6 просмотров · 10 июн 2026, 22:25
-
- Вторая 3090 с Авито или одна 5090: на чём жить с локальными LLM в 2026?
в «Локальные LLM и open-source модели» · 5 ответов · 7 просмотров · 09 июн 2026, 20:43
-
- Б/у RTX 3090 за 55-60к под локальные нейронки в 2026 — авантюра или лучший вариант?
в «Сборка ПК и комплектующие» · 5 ответов · 8 просмотров · 09 июн 2026, 05:35
-
- Посчитал что выгоднее в 2026: б/у 3090 дома или аренда в облаке. Выкладываю цифры, разносите
в «Нейрогенерация: изображения и видео» · 7 ответов · 6 просмотров · 16 май 2026, 06:21