Почему в 2026 каждый туториал по локалкам начинается с ollama
Рейтинг: 20.7% · 1 голосов
Войдите, чтобы голосовать
Голосовать «За» и «Против» могут только авторизованные пользователи. Войдите в свой аккаунт — или зарегистрируйтесь, это займёт минуту.
Нет аккаунта? Зарегистрироваться
Почему в 2026 каждый туториал по локалкам начинается с ollama
Серьезно, открываешь любой гайд, хоть на хабре, хоть на ютубе, везде install ollama и погнали. При том что llama.cpp давно умеет все то же из коробки: llama-server с нормальным веб интерфейсом, openai совместимый api, скачивание модели одной командой через -hf. Нужно жонглировать моделями, ставишь llama-swap и готово.
А что оллама. Дефолтный контекст, про который молчат, и люди потом неделями выясняют почему модель все забывает. Молчаливый квант по умолчанию. Реестр, где модели переименованы как попало, все помнят историю с deepseek r1, когда полстраны думало что гоняет r1 на ноутбуке, а гоняло дистилл на 7b. А теперь в каждом релизе еще и облачный turbo пушат, инструмент для локального запуска продает облако, оцените иронию.
Я не понимаю, это привычка или карго культ?
А что оллама. Дефолтный контекст, про который молчат, и люди потом неделями выясняют почему модель все забывает. Молчаливый квант по умолчанию. Реестр, где модели переименованы как попало, все помнят историю с deepseek r1, когда полстраны думало что гоняет r1 на ноутбуке, а гоняло дистилл на 7b. А теперь в каждом релизе еще и облачный turbo пушат, инструмент для локального запуска продает облако, оцените иронию.
Я не понимаю, это привычка или карго культ?
✔ Лучший ответ сформирован автоматически — remotepanic
Потому что ollama pull и работает. А твой путь это: найди релиз llama.cpp под свою систему, пойми чем cuda сборка отличается от vulkan, выбери правильный gguf из сорока файлов на странице у bartowski, разберись с флагами. Для человека, который хочет вечером попробовать что это вообще такое, барьер реальный. Я сам сижу на чистом llama-server, но новичку рекомендую олламу и не стыжусь.
- remotepanic
- Сообщения: 11
- Зарегистрирован: 19 май 2026, 10:04
Re: Почему в 2026 каждый туториал по локалкам начинается с ollama
✔ Лучший ответ — сформирован автоматически
Потому что ollama pull и работает. А твой путь это: найди релиз llama.cpp под свою систему, пойми чем cuda сборка отличается от vulkan, выбери правильный gguf из сорока файлов на странице у bartowski, разберись с флагами. Для человека, который хочет вечером попробовать что это вообще такое, барьер реальный. Я сам сижу на чистом llama-server, но новичку рекомендую олламу и не стыжусь.
- sleepyraccoon
- Сообщения: 35
- Зарегистрирован: 13 май 2026, 11:17
Re: Почему в 2026 каждый туториал по локалкам начинается с ollama
душный момент: дефолтный контекст в олламе уже давно подняли, не 2048 как в древние времена. но сути не меняет, молча резать контекст это подстава. сам в свое время два дня дебажил почему rag теряет куски документа, а это num_ctx был
- heinrich48
- Сообщения: 21
- Зарегистрирован: 11 май 2026, 16:34
Re: Почему в 2026 каждый туториал по локалкам начинается с ollama
@sleepyraccoon, vllm дома для одного юзера это пушка по воробьям. он под нагрузку и батчи заточен, на одной карте для чата профита ноль, а vram под kv кэш отъедает сразу и жадно. и gguf там до сих пор экспериментальный, кванты считай только awq и gptq
- redislover
- Сообщения: 29
- Зарегистрирован: 12 май 2026, 03:09
Поделиться темой:
✈ Telegram
VK
- Похожие темы
-
- Раздул CLAUDE.md до 400 строк, и стало ХУЖЕ — кто-нибудь объяснит почему
10 ответов · 1260 просмотров
-
- Священная война: Traefik vs Nginx Proxy Manager vs Caddy — кто на чём сидит и почему
18 ответов · 972 просмотров
-
-
-
- Полдня тупил почему телефон не заряжается быстро — а это кабель из коробки от наушников
10 ответов · 434 просмотров
-
Кто сейчас на конференции
Сейчас этот форум просматривают: нет зарегистрированных пользователей и 2 гостя