Стоит ли брать 2x3090 бу или одну 4090 под локальные модели в 2026

Рейтинг: 60.1% · 14 голосов
Запуск больших языковых моделей локально: Llama, Mistral, Qwen, DeepSeek, Gemma. Квантизация GGUF, Ollama, llama.cpp, vLLM, LM Studio, выбор GPU и оптимизация инференса.
Ответить
Аватара пользователя
marianna
Сообщения: 70
Зарегистрирован: 11 май 2026, 11:23

Стоит ли брать 2x3090 бу или одну 4090 под локальные модели в 2026

Сообщение marianna »

Собираю машину под локальный инференз и завис на выборе: две бу 3090 по 24гб (итого 48гб vram) или одна новая 4090 на 24гб. По деньгам в СНГ сейчас примерно сопоставимо, бу 3090 берут по 55-65к за штуку, 4090 новая ушла за 200+ так что вру, скорее сравниваю 2x3090 примерно за 120-130к против бу 4090 за те же деньги если повезёт. Цель крутить модели 30-70B локально для кода и агентов. Что разумнее, объём памяти под большие веса или скорость одной карты.
👍 ❤️1 🔥 😄 🤔
✔ Лучший ответ сформирован автоматически — Tcraw62981
Я через это прошёл, расскажу как есть. Взял две бу 3090 год назад, суммарно вышло дешевле одной 4090 и я получил 48гб. Что хорошо: реально кручу 70B Q4, qwen3 235B в MoE раскладке частично на карты частично в ram идёт, влезают модели которые на 24гб даже не мечтай. Что плохо и о чём не пишут в восторженных постах: первое, питание и тепло это отдельный квест, у меня в комнате летом +4 градуса от д…
Перейти к ответу →
Аватара пользователя
bunmaker
Сообщения: 40
Зарегистрирован: 11 май 2026, 23:26

Re: Стоит ли брать 2x3090 бу или одну 4090 под локальные модели в 2026

Сообщение bunmaker »

@marianna, две 3090 без вариантов если тебе 70B нужны. На одной 24гб ты 70B даже в Q3 не запихнёшь нормально, а на 48гб 70B Q4 влезает и работает
👍1 ❤️ 🔥 😄1 🤔
Аватара пользователя
juniorredteam
Сообщения: 66
Зарегистрирован: 11 май 2026, 07:16

Re: Стоит ли брать 2x3090 бу или одну 4090 под локальные модели в 2026

Сообщение juniorredteam »

имей в виду что 3090 это печка и жрёт 350вт каждая, две карты это 700вт только видео плюс остальное. Блок бери минимум 1000вт качественный и думай про охлаждение корпуса, иначе они друг друга греть будут
👍2 ❤️ 🔥2 😄 🤔
Аватара пользователя
seniorsamurai
Сообщения: 44
Зарегистрирован: 15 май 2026, 19:29

Re: Стоит ли брать 2x3090 бу или одну 4090 под локальные модели в 2026

Сообщение seniorsamurai »

bunmaker писал(а):на 48гб 70B Q4 влезает и работает
влезает да, но скажи человеку честно про скорость. На двух 3090 в llama.cpp с разбивкой по слоям 70B Q4 даёт около 15-18 ток/сек, потому что карты работают по очереди а не параллельно, тензор параллелизм в llama.cpp не настоящий. Это терпимо для чата но для агента который гоняет много шагов уже раздражает. Объём получишь, скорость 70B не порадует
👍 ❤️ 🔥 😄 🤔
Аватара пользователя
nixosaddict
Сообщения: 9
Зарегистрирован: 17 май 2026, 18:46

Re: Стоит ли брать 2x3090 бу или одну 4090 под локальные модели в 2026

Сообщение nixosaddict »

@marianna, + за две 3090, сам так собрал в прошлом году
👍 ❤️1 🔥 😄 🤔
Аватара пользователя
kingcnut
Сообщения: 33
Зарегистрирован: 12 май 2026, 07:12

Re: Стоит ли брать 2x3090 бу или одну 4090 под локальные модели в 2026

Сообщение kingcnut »

@seniorsamurai, А мост nvlink имеет смысл докупать на 2x3090? кто пробовал
👍 ❤️ 🔥 😄 🤔
Аватара пользователя
solidity2024
Сообщения: 40
Зарегистрирован: 11 май 2026, 02:34

Re: Стоит ли брать 2x3090 бу или одну 4090 под локальные модели в 2026

Сообщение solidity2024 »

@bunmaker, @quietbuild для инференса в llama.cpp nvlink почти ничего не даёт, там обмен между картами небольшой. Он полезен на обучении/тюнинге где градиенты гоняются. Не трать деньги на мост ради инференса
👍2 ❤️ 🔥 😄 🤔
Аватара пользователя
Tcraw62981
Сообщения: 41
Зарегистрирован: 11 май 2026, 21:02

Re: Стоит ли брать 2x3090 бу или одну 4090 под локальные модели в 2026

Сообщение Tcraw62981 »

✔ Лучший ответ — сформирован автоматически
Я через это прошёл, расскажу как есть. Взял две бу 3090 год назад, суммарно вышло дешевле одной 4090 и я получил 48гб. Что хорошо: реально кручу 70B Q4, qwen3 235B в MoE раскладке частично на карты частично в ram идёт, влезают модели которые на 24гб даже не мечтай. Что плохо и о чём не пишут в восторженных постах: первое, питание и тепло это отдельный квест, у меня в комнате летом +4 градуса от двух карт, пришлось докупать корпусные вентиляторы и андервольтить обе до 280вт (потеря скорости копеечная, нагрев сильно меньше). Второе, бу 3090 это лотерея, у одной из моих через полгода начал шуметь вентилятор, пришлось менять, проверяй карты на месте под нагрузкой а не по фоткам. Третье, для тензор параллелизма с реальным ускорением нужен vLLM а не llama.cpp, а vLLM на потребительских картах капризный и кванты у него хуже поддержаны. Если бы цель была только модели до 32B и скорость, я бы взял одну 4090 и не парился. Под 70B и эксперименты с большими весами две 3090 оправданы, но готовься что это не воткнул и забыл, а немного хобби-сисадминство.
👍1 ❤️ 🔥1 😄 🤔1
Аватара пользователя
Kutz
Сообщения: 71
Зарегистрирован: 16 май 2026, 02:21

Re: Стоит ли брать 2x3090 бу или одну 4090 под локальные модели в 2026

Сообщение Kutz »

Tcraw62981 писал(а):у меня в комнате летом +4 градуса от двух карт
лол это не шутка вообще, у меня с одной 3090 зимой нормально а летом сижу с включённым кондеем иначе плавлюсь. Две это уже мини-обогреватель, учитывай в эксплуатации, по электричеству тоже набегает если гонять сутками
👍 ❤️ 🔥 😄 🤔
Ответить
Поделиться темой: ✈ Telegram VK

Вернуться в «Локальные LLM и open-source модели»

Кто сейчас на конференции

Сейчас этот форум просматривают: нет зарегистрированных пользователей и 0 гостей