Перестаньте советовать vLLM всем подряд, это не замена llama.cpp

Рейтинг: 19.2% · 30 голосов
Запуск больших языковых моделей локально: Llama, Mistral, Qwen, DeepSeek, Gemma. Квантизация GGUF, Ollama, llama.cpp, vLLM, LM Studio, выбор GPU и оптимизация инференса.
Аватара пользователя
roman_js5
Сообщения: 26
Зарегистрирован: Пн май 11, 2026 12:17 am

Re: Перестаньте советовать vLLM всем подряд, это не замена llama.cpp

Сообщение roman_js5 »

lurker42, бери Ollama или llama-server. API есть, GGUF тянет любой, VRAM не отжирает всю. vLLM подключишь когда юзеров станет больше одного.
👍 ❤️1 🔥 😄 🤔
Аватара пользователя
webproxy2636
Сообщения: 11
Зарегистрирован: Вс май 10, 2026 10:00 pm

Re: Перестаньте советовать vLLM всем подряд, это не замена llama.cpp

Сообщение webproxy2636 »

lurker42, +1 к Ollama для старта. Когда упрёшься в потолок по конкуренции, тогда vLLM. Не раньше.
👍 ❤️ 🔥 😄 🤔
Аватара пользователя
kira_api82
Сообщения: 29
Зарегистрирован: Вт май 12, 2026 8:49 am

Re: Перестаньте советовать vLLM всем подряд, это не замена llama.cpp

Сообщение kira_api82 »

Ещё момент: vLLM апдейтится агрессивно, ломающие изменения прилетают регулярно. На проде пинуй версию и тестируй апгрейды, иначе однажды утром модель не поднимется. Нас так пару раз кусало.
👍2 ❤️ 🔥3 😄 🤔1
Аватара пользователя
jscode1641
Сообщения: 32
Зарегистрирован: Ср май 13, 2026 9:49 am

Re: Перестаньте советовать vLLM всем подряд, это не замена llama.cpp

Сообщение jscode1641 »

Резюме треда: один юзер = llama.cpp/Ollama, много юзеров и throughput = vLLM, edge/оффлайн = llama.cpp. Формат моделей не путаем. Всё, можно закрывать.
👍 ❤️ 🔥 😄 🤔
Аватара пользователя
cachego9376
Сообщения: 22
Зарегистрирован: Вт май 12, 2026 2:46 pm

Re: Перестаньте советовать vLLM всем подряд, это не замена llama.cpp

Сообщение cachego9376 »

perf_freak, идеальное саммари, добавлю в закладки чтобы кидать ссылку вместо ответа в следующих десяти тредах.
👍 ❤️ 🔥1 😄 🤔
Ответить
Поделиться темой: ✈ Telegram VK

Вернуться в «Локальные LLM и open-source модели»

Кто сейчас на конференции

Сейчас этот форум просматривают: нет зарегистрированных пользователей и 1 гость