ollama в 2026, кто-то еще пользуется или все переросли

Рейтинг: 0% · 0 голосов
Запуск больших языковых моделей локально: Llama, Mistral, Qwen, DeepSeek, Gemma. Квантизация GGUF, Ollama, llama.cpp, vLLM, LM Studio, выбор GPU и оптимизация инференса.
Ответить
Аватара пользователя
harro
Сообщения: 4
Зарегистрирован: 31 май 2026, 00:38

ollama в 2026, кто-то еще пользуется или все переросли

Сообщение harro »

Вопрос без наезда (ладно, с небольшим). Кто в 2026 еще сидит на ollama и главное зачем. Слез полгода назад и не понимаю как терпел.

Дефолтный контекст 4096, который он молча обрезает, а потом люди пишут что модель тупая и все забывает. Квант по дефолту один, хочешь другой, иди копайся в тегах. Своя прослойка поверх llama.cpp, которая отстает от апстрима на месяц-два. История с deepseek-r1, когда дистилляты квена обозвали r1 и половина интернета думала что гоняет настоящий дипсик на ноуте. А теперь еще облако свое пихают в каждом релизе.

Перешел на llama-server плюс llama-swap, конфиг в yaml, полный контроль над флагами, модели с hf руками. Порог входа выше, да. Но ollama по ощущениям теперь больше про подписку, чем про локальный запуск.
👍2 ❤️ 🔥 😄 🤔
✔ Лучший ответ сформирован автоматически — cohenst1
harro писал(а):половина интернета думала что гоняет настоящий дипсик на ноуте вот это было позорище года, кстати. до сих пор в комментах под роликами пишут запустил deepseek на 8 гигах, ага, конечно. семерка квена с дистилляцией это не r1 ни разу, а ollama своим неймингом эту кашу и заварила. за одно это им жирный минус
Перейти к ответу →
Аватара пользователя
sepiatone
Сообщения: 30
Зарегистрирован: 20 май 2026, 09:19

Re: ollama в 2026, кто-то еще пользуется или все переросли

Сообщение sepiatone »

юзаю и не жужжу. мне надо раз в неделю быстро что-то проверить, ollama run и поехали. не у всех есть желание разбираться в полусотне флагов llama-server. инструмент под задачу, чего воевать то
👍1 ❤️2 🔥 😄 🤔1
Аватара пользователя
darthb
Сообщения: 19
Зарегистрирован: 11 май 2026, 05:25

Re: ollama в 2026, кто-то еще пользуется или все переросли

Сообщение darthb »

ollama это докер для нейронок. ставится за минуту, работает везде одинаково. душнилы опять воюют с удобством, классика жанра
👍 ❤️ 🔥 😄1 🤔
Аватара пользователя
cohenst1
Сообщения: 92
Зарегистрирован: 11 май 2026, 02:08

Re: ollama в 2026, кто-то еще пользуется или все переросли

Сообщение cohenst1 »

✔ Лучший ответ — сформирован автоматически
harro писал(а):половина интернета думала что гоняет настоящий дипсик на ноуте
вот это было позорище года, кстати. до сих пор в комментах под роликами пишут запустил deepseek на 8 гигах, ага, конечно. семерка квена с дистилляцией это не r1 ни разу, а ollama своим неймингом эту кашу и заварила. за одно это им жирный минус
👍1 ❤️ 🔥 😄 🤔
Аватара пользователя
jodgould
Сообщения: 9
Зарегистрирован: 26 май 2026, 10:01

Re: ollama в 2026, кто-то еще пользуется или все переросли

Сообщение jodgould »

посередине есть lm studio. гуи, любые кванты с hf в пару кликов, на маках mlx из коробки, движки обновляются отдельно от морды. электрон правда жрет память как не в себя, но жить можно. на сервере понятно llama-server без вариантов
👍 ❤️ 🔥1 😄 🤔
Аватара пользователя
py87
Сообщения: 4
Зарегистрирован: 18 май 2026, 17:42

Re: ollama в 2026, кто-то еще пользуется или все переросли

Сообщение py87 »

darthb писал(а):ollama это докер для нейронок
докер не режет молча контекст до 4к и не подсовывает облачную подписку при апдейте. аналогия была бы честной, если бы докер по дефолту давал контейнеру 64 мега памяти и нигде об этом не писал. удобство, которое незаметно портит результат, это не удобство, это подстава
👍 ❤️ 🔥 😄 🤔
Аватара пользователя
k8s4
Сообщения: 5
Зарегистрирован: 14 май 2026, 19:24

Re: ollama в 2026, кто-то еще пользуется или все переросли

Сообщение k8s4 »

вы спорите про игрушки. в проде vllm и точка, continuous batching, нормальный throughput, метрики. все эти лламы-свапы для домашнего поиграться
👍2 ❤️ 🔥 😄 🤔
Аватара пользователя
seniornullptr
Сообщения: 7
Зарегистрирован: 13 май 2026, 23:56

Re: ollama в 2026, кто-то еще пользуется или все переросли

Сообщение seniornullptr »

k8s4 писал(а):в проде vllm и точка
тред про домашний инференс вообще-то, перечитай ОП. и попробуй свой vllm поднять на одной 3090 с gguf, ах да, он же их толком не умеет, сиди конверти в awq под каждую модель. дома llama.cpp, в проде vllm, тут даже спорить не о чем
👍 ❤️ 🔥 😄 🤔
Ответить
Поделиться темой: ✈ Telegram VK

Вернуться в «Локальные LLM и open-source модели»

Кто сейчас на конференции

Сейчас этот форум просматривают: нет зарегистрированных пользователей и 0 гостей