собрал риг на 2x 3090 под 70B, поделюсь ценами и граблями июнь 2026
Рейтинг: 68.5% · 14 голосов
Войдите, чтобы голосовать
Голосовать «За» и «Против» могут только авторизованные пользователи. Войдите в свой аккаунт — или зарегистрируйтесь, это займёт минуту.
Нет аккаунта? Зарегистрироваться
собрал риг на 2x 3090 под 70B, поделюсь ценами и граблями июнь 2026
собрал домашний риг под локальный инференс 70B моделей на двух 3090, делюсь конфигом и ценами по Москве на июнь 2026, потому что когда сам собирал инфа была разрозненная. итог: Llama 3.3 70B в Q4_K_M идёт 16-18 t/s, влезает с контекстом 16к в fp16 кэше. карты б/у с авито по 58-62к за штуку, брал у двух разных продавцов чтобы не пожар. матери взял老 X299 чтобы было два полноценных x16 слота и 128гб ддр4. блок на 1300вт, обе карты андервольтнул до 280вт лимита, по скорости минус 5% по теплу и шуму огромный плюс.
✔ Лучший ответ сформирован автоматически — leewardms
lentyaj писал(а):матери взял老 X299 чтобы было два полноценных x16 слота для инференса x16 на вторую карту не критично если ты не тренишь и не гоняешь tensor parallel постоянно. при сплите по слоям через llama.cpp между картами идёт мало трафика, x8 хватит за глаза. так что люди могут не гнаться за дорогими платами с двумя x16, обычная am5 с x16+x4 потянет, чуть медленнее загрузка модели и всё.
Re: собрал риг на 2x 3090 под 70B, поделюсь ценами и граблями июнь 2026
@mstrbates, андервольт до 280вт мастхэв, без него две карты рядом в закрытом корпусе это печка и троттлинг. у меня в опен фрейме стоят, колхоз но дышат
Re: собрал риг на 2x 3090 под 70B, поделюсь ценами и граблями июнь 2026
✔ Лучший ответ — сформирован автоматически
для инференса x16 на вторую карту не критично если ты не тренишь и не гоняешь tensor parallel постоянно. при сплите по слоям через llama.cpp между картами идёт мало трафика, x8 хватит за глаза. так что люди могут не гнаться за дорогими платами с двумя x16, обычная am5 с x16+x4 потянет, чуть медленнее загрузка модели и всё.lentyaj писал(а):матери взял老 X299 чтобы было два полноценных x16 слота
- seniorwarlock
- Сообщения: 57
- Зарегистрирован: 12 май 2026, 00:23
Re: собрал риг на 2x 3090 под 70B, поделюсь ценами и граблями июнь 2026
@dread по слоям да, а если vLLM с tensor parallel то x4 на второй карте уже бьёт по скорости заметно, там карты реально болтают между собой каждый шаг. зависит от бэкенда короче. ОП на llama.cpp сидит ему пофиг, а кто на vLLM полезет пусть учитывает
Re: собрал риг на 2x 3090 под 70B, поделюсь ценами и граблями июнь 2026
@seniorwarlock, вопрос не по теме, а нвлинк на 3090 даёт что нибудь для этого? мост стоит копейки вроде
Re: собрал риг на 2x 3090 под 70B, поделюсь ценами и граблями июнь 2026
@leewardms, @quasar даёт но в основном для тренировки и tensor parallel в vLLM, для llama.cpp сплита почти нет профита потому что обмен и так маленький. мост на 3090 это 4-слотовый, под две карты подряд физически часто не встаёт, смотри расстояние между слотами. я бы не заморачивался ради инференса.
Поделиться темой:
✈ Telegram
VK
- Похожие темы
-
-
- WireGuard режут DPI за минуту, перешёл на VLESS+Reality — делюсь граблями
18 ответов · 755 просмотров
-
-
- CUDA out of memory — собрал список того, что реально помогает (а не магия)
9 ответов · 485 просмотров
-
- Что реально спрашивают на system design в 2026 для бэкенда, собрал с 6 собесов
7 ответов · 455 просмотров
-
- Перевели монорепу на TypeScript 7 (tsgo): типчек с 3 минут до 15 секунд, делюсь граблями
4 ответов · 17 просмотров
Кто сейчас на конференции
Сейчас этот форум просматривают: нет зарегистрированных пользователей и 2 гостя