ollama в 2026, кто-то еще пользуется или все переросли
Рейтинг: 0% · 0 голосов
Войдите, чтобы голосовать
Голосовать «За» и «Против» могут только авторизованные пользователи. Войдите в свой аккаунт — или зарегистрируйтесь, это займёт минуту.
Нет аккаунта? Зарегистрироваться
ollama в 2026, кто-то еще пользуется или все переросли
Вопрос без наезда (ладно, с небольшим). Кто в 2026 еще сидит на ollama и главное зачем. Слез полгода назад и не понимаю как терпел.
Дефолтный контекст 4096, который он молча обрезает, а потом люди пишут что модель тупая и все забывает. Квант по дефолту один, хочешь другой, иди копайся в тегах. Своя прослойка поверх llama.cpp, которая отстает от апстрима на месяц-два. История с deepseek-r1, когда дистилляты квена обозвали r1 и половина интернета думала что гоняет настоящий дипсик на ноуте. А теперь еще облако свое пихают в каждом релизе.
Перешел на llama-server плюс llama-swap, конфиг в yaml, полный контроль над флагами, модели с hf руками. Порог входа выше, да. Но ollama по ощущениям теперь больше про подписку, чем про локальный запуск.
Дефолтный контекст 4096, который он молча обрезает, а потом люди пишут что модель тупая и все забывает. Квант по дефолту один, хочешь другой, иди копайся в тегах. Своя прослойка поверх llama.cpp, которая отстает от апстрима на месяц-два. История с deepseek-r1, когда дистилляты квена обозвали r1 и половина интернета думала что гоняет настоящий дипсик на ноуте. А теперь еще облако свое пихают в каждом релизе.
Перешел на llama-server плюс llama-swap, конфиг в yaml, полный контроль над флагами, модели с hf руками. Порог входа выше, да. Но ollama по ощущениям теперь больше про подписку, чем про локальный запуск.
✔ Лучший ответ сформирован автоматически — cohenst1
harro писал(а):половина интернета думала что гоняет настоящий дипсик на ноуте вот это было позорище года, кстати. до сих пор в комментах под роликами пишут запустил deepseek на 8 гигах, ага, конечно. семерка квена с дистилляцией это не r1 ни разу, а ollama своим неймингом эту кашу и заварила. за одно это им жирный минус
Re: ollama в 2026, кто-то еще пользуется или все переросли
✔ Лучший ответ — сформирован автоматически
вот это было позорище года, кстати. до сих пор в комментах под роликами пишут запустил deepseek на 8 гигах, ага, конечно. семерка квена с дистилляцией это не r1 ни разу, а ollama своим неймингом эту кашу и заварила. за одно это им жирный минусharro писал(а):половина интернета думала что гоняет настоящий дипсик на ноуте
Re: ollama в 2026, кто-то еще пользуется или все переросли
посередине есть lm studio. гуи, любые кванты с hf в пару кликов, на маках mlx из коробки, движки обновляются отдельно от морды. электрон правда жрет память как не в себя, но жить можно. на сервере понятно llama-server без вариантов
Re: ollama в 2026, кто-то еще пользуется или все переросли
докер не режет молча контекст до 4к и не подсовывает облачную подписку при апдейте. аналогия была бы честной, если бы докер по дефолту давал контейнеру 64 мега памяти и нигде об этом не писал. удобство, которое незаметно портит результат, это не удобство, это подставаdarthb писал(а):ollama это докер для нейронок
- seniornullptr
- Сообщения: 7
- Зарегистрирован: 13 май 2026, 23:56
Re: ollama в 2026, кто-то еще пользуется или все переросли
тред про домашний инференс вообще-то, перечитай ОП. и попробуй свой vllm поднять на одной 3090 с gguf, ах да, он же их толком не умеет, сиди конверти в awq под каждую модель. дома llama.cpp, в проде vllm, тут даже спорить не о чемk8s4 писал(а):в проде vllm и точка
Поделиться темой:
✈ Telegram
VK
- Похожие темы
-
-
-
- Raspberry Pi 5 или мини-ПК для домашнего сервера в 2026? Уже сомневаюсь
10 ответов · 2908 просмотров
-
-
- С чего реально начать в пентесте в 2026? TryHackMe, HTB или сразу сертификаты?
12 ответов · 1917 просмотров
-
Кто сейчас на конференции
Сейчас этот форум просматривают: нет зарегистрированных пользователей и 0 гостей