DeepSeek выложил веса V4 под MIT: заявляют уровень фронтира при цене API в разы ниже. Кто уже щупал?
Рейтинг: 59% · 17 голосов
Войдите, чтобы голосовать
Голосовать «За» и «Против» могут только авторизованные пользователи. Войдите в свой аккаунт — или зарегистрируйтесь, это займёт минуту.
Нет аккаунта? Зарегистрироваться
DeepSeek выложил веса V4 под MIT: заявляют уровень фронтира при цене API в разы ниже. Кто уже щупал?
Сегодня ночью DeepSeek без особых анонсов опубликовал веса V4. Коротко по фактам из их техрепорта: MoE примерно на 880 млрд параметров суммарно, активных ~42 млрд на токен, контекст 256k, лицензия MIT без ограничений на коммерцию. По заявленным бенчам — около 72% на SWE-bench Verified и сильный скачок в математике, то есть формально догоняют закрытые топы прошлой зимы. API подняли сразу: что-то около 0.5 доллара за миллион входных токенов и 1.8 за выходные — это в 6–8 раз дешевле западных аналогов сопоставимого класса. Обещают дистилляты на 32B и 9B в течение двух недель. Интересует не пересказ репорта, а живой опыт: кто уже гонял на реальных задачах? Особенно интересно качество русского и кода.
✔ Лучший ответ сформирован автоматически — lonelygoblin
@pg1, Остужу немного. SWE-bench Verified в 2026 году не значит примерно ничего: задачи собраны из публичных репозиториев, и контаминация обучающих данных почти гарантирована — это касается всех вендоров, не только китайцев. Доверять можно только собственным закрытым evals. У нас такой есть: 300 задач на генерацию SQL по русскоязычной схеме данных с подвохами. Результаты сегодняшнего прогона: V4 —…
Re: DeepSeek выложил веса V4 под MIT: заявляют уровень фронтира при цене API в разы ниже. Кто уже щупал?
Погонял ночью через OpenRouter на своих рабочих тикетах — рефакторинг легаси на Django, миграции, тесты. Субъективно: уверенно лучше их же V3.2, по коду где-то на уровне закрытых моделей среднего эшелона, до самых топов чуть не дотягивает на многошаговых задачах — теряет контекст изменений после 5–6 итераций. Но при такой цене это вообще другая категория сравнения. Русский стал заметно чище: канцелярит и кальки с английского, которыми страдал V3, почти ушли.
- lonelygoblin
- Сообщения: 61
- Зарегистрирован: 12 май 2026, 12:45
Re: DeepSeek выложил веса V4 под MIT: заявляют уровень фронтира при цене API в разы ниже. Кто уже щупал?
✔ Лучший ответ — сформирован автоматически
@pg1, Остужу немного. SWE-bench Verified в 2026 году не значит примерно ничего: задачи собраны из публичных репозиториев, и контаминация обучающих данных почти гарантирована — это касается всех вендоров, не только китайцев. Доверять можно только собственным закрытым evals. У нас такой есть: 300 задач на генерацию SQL по русскоязычной схеме данных с подвохами. Результаты сегодняшнего прогона: V4 — 61%, V3.2 — 58%, топовая закрытая модель — 71%. То есть прогресс реальный, но «уровень фронтира» — это пока маркетинг. Что честно впечатляет — стабильность формата ответа: из 300 запросов ни одного сломанного JSON, у конкурентов 2–4% брака стабильно.
Re: DeepSeek выложил веса V4 под MIT: заявляют уровень фронтира при цене API в разы ниже. Кто уже щупал?
По железу для желающих в self-host: полные веса — порядка 450 ГБ в FP8, то есть это нода на 8×H100 минимум, либо городить кластер из маков со 512 ГБ unified memory, что для прода несерьёзно. Аренда такой ноды в РФ сейчас 1.2–1.5 млн рублей в месяц — окупается только при действительно больших объёмах генерации. Для всех остальных смысл релиза — в обещанных дистиллятах: если 32B сохранит хотя бы 80% качества по коду, это будет рабочая лошадка на одну-две карты.
Re: DeepSeek выложил веса V4 под MIT: заявляют уровень фронтира при цене API в разы ниже. Кто уже щупал?
Для нашего сегмента главная новость вообще не бенчмарки, а строчка «MIT license». Я работаю в банке: западные API комплаенс не пропускает в принципе, отечественные модели по качеству генерации кода сильно позади, а тут — легальный self-host фронтир-класса в закрытом контуре, без телеметрии и без вопросов от безопасников про трансграничную передачу. Уже утром завели задачу на пилот, безопасники впервые на моей памяти не сопротивлялись. Подозреваю, через полгода половина энтерпрайза СНГ будет сидеть именно на таких релизах.
Поделиться темой:
✈ Telegram
VK
- Похожие темы
-
-
-
- Выложил бесплатный курс про устройство поисковиков: 23 модуля от краулинга до ранжирования
7 ответов · 73 просмотров
-
-
- DeepSeek R2 вышел: бенчи на уровне топов, цена в 20 раз ниже. Кто уже щупал?
7 ответов · 6 просмотров
-
- DeepSeek выложила R2: открытые веса уровня западных топов, цены на токены снова летят вниз
5 ответов · 5 просмотров
Кто сейчас на конференции
Сейчас этот форум просматривают: нет зарегистрированных пользователей и 1 гость