оптимизация инференса
Обсуждения по теме «оптимизация инференса» — 1 тем, 6 ответов, 3 просмотров. Вопросы, решения и практический опыт участников. · все теги
Похожие теги:
llama.cpp против ollama 1настройка llama.cpp скорость 1
- Темы
-
- Потратил выходные на тонкую настройку llama.cpp и она оказалась медленнее ollama из коробки
в «Локальные LLM и open-source модели» · 6 ответов · 3 просмотров · 14 май 2026, 06:58