Запустил Qwen3.6 235B дома на б/у эпике без топовой видяхи, делюсь цифрами

Рейтинг: 48.7% · 7 голосов
Запуск больших языковых моделей локально: Llama, Mistral, Qwen, DeepSeek, Gemma. Квантизация GGUF, Ollama, llama.cpp, vLLM, LM Studio, выбор GPU и оптимизация инференса.
Аватара пользователя
kingcnut
Сообщения: 33
Зарегистрирован: 12 май 2026, 07:12

Re: Запустил Qwen3.6 235B дома на б/у эпике без топовой видяхи, делюсь цифрами

Сообщение kingcnut »

такие треды потом аукаются. полгода назад h11ssl на авито лежали по 18к, теперь 24 и улетают за день, серверная ddr4 тоже поползла. кто сомневается, собирайте сейчас, дешевле уже не будет
👍1 ❤️ 🔥 😄 🤔
✔ Лучший ответ сформирован автоматически — asynclover
johnmal писал(а):вход в 20к токенов жуется минуты четыре так он целиком жуется ровно один раз. кеш промпта в llama.cpp никто не отменял, диалог дальше идет инкрементально, плюс --prompt-cache на диск для повторяющихся системников. больно только когда каждый раз свежий документ на 20к, вот там да, иди чай заваривай. для чатов и агентских циклов, где контекст растет постепенно, вполне живется
Перейти к ответу →
Ответить
Поделиться темой: ✈ Telegram VK

Вернуться в «Локальные LLM и open-source модели»

Кто сейчас на конференции

Сейчас этот форум просматривают: нет зарегистрированных пользователей и 1 гость