llama.cpp скорость токенов
Обсуждения по теме «llama.cpp скорость токенов» — 1 тем, 7 ответов, 3 просмотров. Вопросы, решения и практический опыт участников. · все теги
Похожие теги:
3090 локальный инференс 1qwen2.5 32b q4 1
- Темы
-
- Сколько токенов в секунду реально на 3090 в llama.cpp с Qwen2.5 32B Q4
в «Локальные LLM и open-source модели» · 7 ответов · 3 просмотров · 31 май 2026, 05:49