Локальная модель для кода на своём железе — кто что гоняет в 2026?

Теги: #DeepSeek#Qwen
Рейтинг: 82.3% · 69 голосов
Программирование с искусственным интеллектом: Claude Code, Cursor, GitHub Copilot, agentic coding, протокол MCP, генерация и ревью кода, автоматизация рабочего процесса разработчика.
Ответить
Аватара пользователя
mlflow7030
Сообщения: 4
Зарегистрирован: Пн май 11, 2026 8:11 am

Локальная модель для кода на своём железе — кто что гоняет в 2026?

Сообщение mlflow7030 »

Достало платить за облако и сливать код наружу. Хочу локально для автодополнения и мелких задач. Сейчас актуальны Qwen3-Coder и DeepSeek. На чём вы крутите и какой квант реально юзабелен?
👍1 ❤️ 🔥1 😄 🤔
Аватара пользователя
pixeldns752
Сообщения: 15
Зарегистрирован: Пн май 11, 2026 10:41 am

Re: Локальная модель для кода на своём железе — кто что гоняет в 2026?

Сообщение pixeldns752 »

Qwen2.5-Coder 32B в Q4_K_M на 4090 (24GB) идёт бодро, ~35 ток/с. Для контекста больше 16к уже впритык по памяти. Для автокомплита беру 7B — летает.
👍4 ❤️2 🔥2 😄2 🤔2
Аватара пользователя
tcploop1339
Сообщения: 29
Зарегистрирован: Пн май 11, 2026 1:27 am

Re: Локальная модель для кода на своём железе — кто что гоняет в 2026?

Сообщение tcploop1339 »

На Mac Studio M2 Ultra 192GB гоняю 32B без квантизации, контекст 64к держу. Скорость не как у 4090, но молчаливый и греется меньше чайника. DeepSeek-Coder V2 тоже норм, но мне Qwen ближе по стилю.
👍1 ❤️ 🔥 😄 🤔
Аватара пользователя
semyon_null56
Сообщения: 32
Зарегистрирован: Пн май 11, 2026 12:44 am

Re: Локальная модель для кода на своём железе — кто что гоняет в 2026?

Сообщение semyon_null56 »

А смысл? Любая локалка 32B рядом не стоит с Sonnet на реальном агентном таске. Для тупого автокомплита ок, для «разрули баг в легаси» — нет.
👍 ❤️ 🔥 😄 🤔
Аватара пользователя
cachego9376
Сообщения: 22
Зарегистрирован: Вт май 12, 2026 2:46 pm

Re: Локальная модель для кода на своём железе — кто что гоняет в 2026?

Сообщение cachego9376 »

pcmaster, у меня NDA и запрет на внешние LLM по договору, выбора особо нет. Вопрос не «лучше ли облака», а «что выжать локально».
👍 ❤️ 🔥2 😄 🤔
Аватара пользователя
mlhex9595
Сообщения: 1
Зарегистрирован: Пн май 11, 2026 6:32 pm

Re: Локальная модель для кода на своём железе — кто что гоняет в 2026?

Сообщение mlhex9595 »

Если упёрся в 24GB — две 3090 через NVLink дешевле одной 4090 по VRAM/деньги, влезает 70B в Q4. Жрёт под 700Вт, готовь БП и форточку.
👍 ❤️ 🔥 😄 🤔
Аватара пользователя
egor1580
Сообщения: 25
Зарегистрирован: Вс май 10, 2026 9:27 pm

Re: Локальная модель для кода на своём железе — кто что гоняет в 2026?

Сообщение egor1580 »

llama.cpp + Ollama самый простой старт, но для продакшен-скорости смотри vLLM или sglang, батчинг другой уровень. На одиночных запросах разница меньше, на параллельных — огромная.
👍 ❤️ 🔥1 😄 🤔1
Аватара пользователя
kira_app10
Сообщения: 23
Зарегистрирован: Вт май 12, 2026 2:35 am

Re: Локальная модель для кода на своём железе — кто что гоняет в 2026?

Сообщение kira_app10 »

Спасибо всем, беру курс на Qwen3-Coder 32B Q4 на 4090 + 7B на автокомплит. Андрей, про две 3090 интересно, но электрик уже косо смотрит)
👍4 ❤️ 🔥1 😄 🤔1
Ответить
Поделиться темой: ✈ Telegram VK
Похожие запросы: qwen vs llama что лучшекак запустить deepseek локальноmistral для локального запуска отзывылучшая локальная llm для кода

Вернуться в «AI-ассистированная разработка»

Кто сейчас на конференции

Сейчас этот форум просматривают: нет зарегистрированных пользователей и 1 гость