Запустил Qwen3.6 235B дома на б/у эпике без топовой видяхи, делюсь цифрами

Austkin · 2026-05-11T10:51:40+00:00

Дозрел до больших MoE и собрал под них отдельную машину из б/у серверного. Конфиг: EPYC 7532 с али за 28к, мать Supermicro H11SSL-i с авито за 24к, 512 гигов DDR4 2933 ECC, 16 планок по 32, вышло около 68к. Плюс корпус, башня, бп, итого где-то 150к. Старая 3060 12GB переехала туда же. Запускаю Qwen3.6-235B-A22B в Q4 ч…

Теги: #Epyc #MoE #cpu инференс #ik_llama.cpp

Рейтинг: 48.7% · 7 голосов

Ответить

11 сообщений

kingcnut: Сообщения: 33; Зарегистрирован: 12 май 2026, 07:12

Re: Запустил Qwen3.6 235B дома на б/у эпике без топовой видяхи, делюсь цифрами

Цитата

Сообщение kingcnut » 11 июн 2026, 23:21

такие треды потом аукаются. полгода назад h11ssl на авито лежали по 18к, теперь 24 и улетают за день, серверная ddr4 тоже поползла. кто сомневается, собирайте сейчас, дешевле уже не будет

👍1 ❤️ 🔥 😄 🤔

✔ Лучший ответ сформирован автоматически — asynclover

johnmal писал(а):вход в 20к токенов жуется минуты четыре так он целиком жуется ровно один раз. кеш промпта в llama.cpp никто не отменял, диалог дальше идет инкрементально, плюс --prompt-cache на диск для повторяющихся системников. больно только когда каждый раз свежий документ на 20к, вот там да, иди чай заваривай. для чатов и агентских циклов, где контекст растет постепенно, вполне живется

Перейти к ответу →

Ответить

11 сообщений

Похожие темы

Поднял цену с $9 до $29 — ушла половина юзеров, но MRR вырос. Делюсь цифрами
21 ответов · 1060 просмотров
DeepSeek R1 локально - кто-нибудь реально запустил полную версию дома?
10 ответов · 1000 просмотров
Первый баг баунти за полгода — делюсь цифрами и граблями
10 ответов · 749 просмотров
Запустил очередную AI-обёртку над GPT — рынок уже не перенасыщен?
11 ответов · 694 просмотров
One-man CI/CD запустил 47 параллельных джобов из-за одной опечатки в имени переменной — делитесь факапами с пайплайнами
9 ответов · 21 просмотров
Снесли все useMemo после включения React Compiler. Месяц в проде, делюсь цифрами
5 ответов · 13 просмотров

Вернуться в «Локальные LLM и open-source модели»

Кто сейчас на конференции

Сейчас этот форум просматривают: нет зарегистрированных пользователей и 1 гость