DeepSeek выложил веса V4 под MIT: заявляют уровень фронтира при цене API в разы ниже. Кто уже щупал?

asyncmonk · Сообщение **asyncmonk** » 08 июн 2026, 17:53

Сегодня ночью DeepSeek без особых анонсов опубликовал веса V4. Коротко по фактам из их техрепорта: MoE примерно на 880 млрд параметров суммарно, активных ~42 млрд на токен, контекст 256k, лицензия MIT без ограничений на коммерцию. По заявленным бенчам — около 72% на SWE-bench Verified и сильный скачок в математике, то есть формально догоняют закрытые топы прошлой зимы. API подняли сразу: что-то около 0.5 доллара за миллион входных токенов и 1.8 за выходные — это в 6–8 раз дешевле западных аналогов сопоставимого класса. Обещают дистилляты на 32B и 9B в течение двух недель. Интересует не пересказ репорта, а живой опыт: кто уже гонял на реальных задачах? Особенно интересно качество русского и кода.

pg1 · Сообщение **pg1** » 08 июн 2026, 21:13

Погонял ночью через OpenRouter на своих рабочих тикетах — рефакторинг легаси на Django, миграции, тесты. Субъективно: уверенно лучше их же V3.2, по коду где-то на уровне закрытых моделей среднего эшелона, до самых топов чуть не дотягивает на многошаговых задачах — теряет контекст изменений после 5–6 итераций. Но при такой цене это вообще другая категория сравнения. Русский стал заметно чище: канцелярит и кальки с английского, которыми страдал V3, почти ушли.

lonelygoblin

@pg1, Остужу немного. SWE-bench Verified в 2026 году не значит примерно ничего: задачи собраны из публичных репозиториев, и контаминация обучающих данных почти гарантирована — это касается всех вендоров, не только китайцев. Доверять можно только собственным закрытым evals. У нас такой есть: 300 задач на генерацию SQL по русскоязычной схеме данных с подвохами. Результаты сегодняшнего прогона: V4 — 61%, V3.2 — 58%, топовая закрытая модель — 71%. То есть прогресс реальный, но «уровень фронтира» — это пока маркетинг. Что честно впечатляет — стабильность формата ответа: из 300 запросов ни одного сломанного JSON, у конкурентов 2–4% брака стабильно.

archlover · Сообщение **archlover** » 09 июн 2026, 03:57

По железу для желающих в self-host: полные веса — порядка 450 ГБ в FP8, то есть это нода на 8×H100 минимум, либо городить кластер из маков со 512 ГБ unified memory, что для прода несерьёзно. Аренда такой ноды в РФ сейчас 1.2–1.5 млн рублей в месяц — окупается только при действительно больших объёмах генерации. Для всех остальных смысл релиза — в обещанных дистиллятах: если 32B сохранит хотя бы 80% качества по коду, это будет рабочая лошадка на одну-две карты.

lena87 · Сообщение **lena87** » 09 июн 2026, 06:25

Для нашего сегмента главная новость вообще не бенчмарки, а строчка «MIT license». Я работаю в банке: западные API комплаенс не пропускает в принципе, отечественные модели по качеству генерации кода сильно позади, а тут — легальный self-host фронтир-класса в закрытом контуре, без телеметрии и без вопросов от безопасников про трансграничную передачу. Уже утром завели задачу на пилот, безопасники впервые на моей памяти не сопротивлялись. Подозреваю, через полгода половина энтерпрайза СНГ будет сидеть именно на таких релизах.

DeepSeek выложил веса V4 под MIT: заявляют уровень фронтира при цене API в разы ниже. Кто уже щупал?

DeepSeek выложил веса V4 под MIT: заявляют уровень фронтира при цене API в разы ниже. Кто уже щупал?

Re: DeepSeek выложил веса V4 под MIT: заявляют уровень фронтира при цене API в разы ниже. Кто уже щупал?

Re: DeepSeek выложил веса V4 под MIT: заявляют уровень фронтира при цене API в разы ниже. Кто уже щупал?

Re: DeepSeek выложил веса V4 под MIT: заявляют уровень фронтира при цене API в разы ниже. Кто уже щупал?

Re: DeepSeek выложил веса V4 под MIT: заявляют уровень фронтира при цене API в разы ниже. Кто уже щупал?

Кто сейчас на конференции