локальные-модели

Запуск моделей на своём железе перестал быть экзотикой: qwen3-coder на 4090 месяцами заменяет облачный Cursor, а вопрос какие веса качать и на чём крутить волнует всё больше людей в СНГ. Тут обсуждают выбор квантов и движков, честно разбирают, что ollama удобна, но привирает про модели и жрёт лишний диск, и когда народ съезжает на чистый llama.cpp. Материал для тех, кто считает экономику локального инференса и хочет приватность без облака.

3 тем, 19 ответов, 12 просмотров · все теги

Похожие теги: железо 2 Qwen 1 cursor 1 LLM 1 ai 1 ollama vs llama.cpp 1 ollama проблемы 1

Темы

ollama это удобно но врёт про модели и жрёт лишнее, кто слезал на llama.cpp
в «Локальные LLM и open-source модели» · 7 ответов · 0 просмотров · 29 май 2026, 02:23
Локальные LLM дома в 2026: какие веса качать, на каком железе крутить и когда это вообще выгодно
в «Статьи и лонгриды» · 6 ответов · 7 просмотров · 26 май 2026, 08:21
Месяц на qwen3-coder с 4090 вместо Cursor, делюсь итогами
в «AI-ассистированная разработка» · 6 ответов · 5 просмотров · 24 май 2026, 04:35