Почему в 2026 каждый туториал по локалкам начинается с ollama

Рейтинг: 20.7% · 1 голосов
Запуск больших языковых моделей локально: Llama, Mistral, Qwen, DeepSeek, Gemma. Квантизация GGUF, Ollama, llama.cpp, vLLM, LM Studio, выбор GPU и оптимизация инференса.
Ответить
Аватара пользователя
nedati
Сообщения: 2
Зарегистрирован: 31 май 2026, 08:36

Почему в 2026 каждый туториал по локалкам начинается с ollama

Сообщение nedati »

Серьезно, открываешь любой гайд, хоть на хабре, хоть на ютубе, везде install ollama и погнали. При том что llama.cpp давно умеет все то же из коробки: llama-server с нормальным веб интерфейсом, openai совместимый api, скачивание модели одной командой через -hf. Нужно жонглировать моделями, ставишь llama-swap и готово.

А что оллама. Дефолтный контекст, про который молчат, и люди потом неделями выясняют почему модель все забывает. Молчаливый квант по умолчанию. Реестр, где модели переименованы как попало, все помнят историю с deepseek r1, когда полстраны думало что гоняет r1 на ноутбуке, а гоняло дистилл на 7b. А теперь в каждом релизе еще и облачный turbo пушат, инструмент для локального запуска продает облако, оцените иронию.

Я не понимаю, это привычка или карго культ?
👍5 ❤️ 🔥 😄 🤔
✔ Лучший ответ сформирован автоматически — remotepanic
Потому что ollama pull и работает. А твой путь это: найди релиз llama.cpp под свою систему, пойми чем cuda сборка отличается от vulkan, выбери правильный gguf из сорока файлов на странице у bartowski, разберись с флагами. Для человека, который хочет вечером попробовать что это вообще такое, барьер реальный. Я сам сижу на чистом llama-server, но новичку рекомендую олламу и не стыжусь.
Перейти к ответу →
Аватара пользователя
remotepanic
Сообщения: 11
Зарегистрирован: 19 май 2026, 10:04

Re: Почему в 2026 каждый туториал по локалкам начинается с ollama

Сообщение remotepanic »

✔ Лучший ответ — сформирован автоматически
Потому что ollama pull и работает. А твой путь это: найди релиз llama.cpp под свою систему, пойми чем cuda сборка отличается от vulkan, выбери правильный gguf из сорока файлов на странице у bartowski, разберись с флагами. Для человека, который хочет вечером попробовать что это вообще такое, барьер реальный. Я сам сижу на чистом llama-server, но новичку рекомендую олламу и не стыжусь.
👍 ❤️1 🔥2 😄 🤔
Аватара пользователя
k8s2000
Сообщения: 85
Зарегистрирован: 11 май 2026, 00:27

Re: Почему в 2026 каждый туториал по локалкам начинается с ollama

Сообщение k8s2000 »

@nedati, история с r1 это жесть была, да. до сих пор попадаются кадры, которые на полном серьезе рассказывают как запускали дипсик р1 на ноуте с 16 гигами
👍 ❤️1 🔥 😄 🤔
Аватара пользователя
sleepyraccoon
Сообщения: 35
Зарегистрирован: 13 май 2026, 11:17

Re: Почему в 2026 каждый туториал по локалкам начинается с ollama

Сообщение sleepyraccoon »

+1 к автору. оллама это удобство в обмен на понимание того, что у тебя вообще запущено. размен так себе
👍1 ❤️1 🔥 😄 🤔
Аватара пользователя
misha12
Сообщения: 67
Зарегистрирован: 11 май 2026, 04:09

Re: Почему в 2026 каждый туториал по локалкам начинается с ollama

Сообщение misha12 »

есть же lm studio, серединка: gui, кванты видно, контекст ползунком, mlx на маках. но сейчас набегут с electron и закрытый код, хах
👍1 ❤️ 🔥1 😄 🤔
Аватара пользователя
tiger71
Сообщения: 44
Зарегистрирован: 10 май 2026, 23:32

Re: Почему в 2026 каждый туториал по локалкам начинается с ollama

Сообщение tiger71 »

душный момент: дефолтный контекст в олламе уже давно подняли, не 2048 как в древние времена. но сути не меняет, молча резать контекст это подстава. сам в свое время два дня дебажил почему rag теряет куски документа, а это num_ctx был
👍 ❤️ 🔥1 😄 🤔
Аватара пользователя
tollie
Сообщения: 38
Зарегистрирован: 12 май 2026, 02:48

Re: Почему в 2026 каждый туториал по локалкам начинается с ollama

Сообщение tollie »

вы все не о том. нормальные люди с гпу давно на vllm, а llama.cpp и оллама это для маков и пенсионеров. continuous batching, paged attention, тензорный параллелизм, вот это все
👍 ❤️2 🔥 😄 🤔
Аватара пользователя
heinrich48
Сообщения: 21
Зарегистрирован: 11 май 2026, 16:34

Re: Почему в 2026 каждый туториал по локалкам начинается с ollama

Сообщение heinrich48 »

@sleepyraccoon, vllm дома для одного юзера это пушка по воробьям. он под нагрузку и батчи заточен, на одной карте для чата профита ноль, а vram под kv кэш отъедает сразу и жадно. и gguf там до сих пор экспериментальный, кванты считай только awq и gptq
👍 ❤️1 🔥 😄1 🤔
Аватара пользователя
redislover
Сообщения: 29
Зарегистрирован: 12 май 2026, 03:09

Re: Почему в 2026 каждый туториал по локалкам начинается с ollama

Сообщение redislover »

очередной vim против emacs. кому надо быстро, ставит олламу, кому надо контроль, собирает llama.cpp, кому надо раздавать модель команде, берет vllm. тема высосана из пальца, расходимся
👍 ❤️1 🔥 😄 🤔1
Ответить
Поделиться темой: ✈ Telegram VK

Вернуться в «Локальные LLM и open-source модели»

Кто сейчас на конференции

Сейчас этот форум просматривают: нет зарегистрированных пользователей и 2 гостя