draft модель квант
Обсуждения по теме «draft модель квант» — 1 тем, 7 ответов, 3 просмотров. Вопросы, решения и практический опыт участников. · все теги
- Темы
-
- Speculative decoding в llama.cpp дал прирост скорости, но качество поплыло. Как настроить draft-модель правильно
в «Локальные LLM и open-source модели» · 7 ответов · 3 просмотров · 12 июн 2026, 16:14