DeepSeek R2 вышел: бенчи на уровне топов, цена в 20 раз ниже. Кто уже щупал?
Рейтинг: 66.7% · 13 голосов
Войдите, чтобы голосовать
Голосовать «За» и «Против» могут только авторизованные пользователи. Войдите в свой аккаунт — или зарегистрируйтесь, это займёт минуту.
Нет аккаунта? Зарегистрироваться
- natebeckham
- Сообщения: 15
- Зарегистрирован: 24 май 2026, 21:20
DeepSeek R2 вышел: бенчи на уровне топов, цена в 20 раз ниже. Кто уже щупал?
Сегодня ночью DeepSeek без всяких анонсов выложил R2. По их цифрам: SWE-bench Verified 74, AIME почти в потолок, контекст 256к. Цена API копеечная, выход около 2.2 доллара за миллион токенов, у западных топов 15-25 за сравнимый класс.
Веса открытые, лицензия MIT, но это 1.2 триллиона параметров MoE, локально такое поднимут полтора энтузиаста с восемью H200.
Классический вопрос: бенчам верим? У V3 в своё время цифры тоже были красивые, а на реальном легаси-коде оно сыпалось. Кто уже гонял на своих задачах, расскажите.
Веса открытые, лицензия MIT, но это 1.2 триллиона параметров MoE, локально такое поднимут полтора энтузиаста с восемью H200.
Классический вопрос: бенчам верим? У V3 в своё время цифры тоже были красивые, а на реальном легаси-коде оно сыпалось. Кто уже гонял на своих задачах, расскажите.
✔ Лучший ответ сформирован автоматически — lentyaj
GpuGuru писал(а):при цене в 2 доллара они почти наверняка торгуют в минус ради захвата рынка не сходится. веса открытые, на опенроутере их уже хостят несколько сторонних провайдеров по 2-3 бакса, и вот им-то захват рынка дипсика до лампочки, в минус ни секунды работать не будут. MoE с активными ~30B реально дешев в инференсе, вся туша на 1.2T одновременно не молотит. так что дорогие западные api …
Re: DeepSeek R2 вышел: бенчи на уровне топов, цена в 20 раз ниже. Кто уже щупал?
гоняю с утра через OpenRouter на рабочих тикетах. впечатления смешанные: питон и го пишет реально на уровне, рефакторинг жирного джанго-проекта вывез лучше, чем я ждал. но русский технический текст заметно слабее, в комментах к коду иногда уезжает в английский посреди фразы. для кода брать можно, для документации нет
Re: DeepSeek R2 вышел: бенчи на уровне топов, цена в 20 раз ниже. Кто уже щупал?
SWE-bench Verified давно маркетинговая цифра, все тюнят на похожих данных, contamination никто не отменял. посмотрю на LiveBench и арену недели через две, когда схлынет хайп. и да, при цене в 2 доллара они почти наверняка торгуют в минус ради захвата рынка. вечно так не будет
Re: DeepSeek R2 вышел: бенчи на уровне топов, цена в 20 раз ниже. Кто уже щупал?
@natebeckham, ради интереса посчитал: в Q4 кванте это около 700 гб весов. даже на эпике с 768 гб оперативки будет полтора токена в секунду, не запуск а слайд-шоу. так что открытые веса тут скорее жест. ждём дистиллы на 30-70B, вот они и станут народными
Re: DeepSeek R2 вышел: бенчи на уровне топов, цена в 20 раз ниже. Кто уже щупал?
полгода назад ровно то же самое было с V3.2, все кричали что западные модели мертвы. потом вышли свежие Gemini и Claude, и все молча переключились обратно. конкуренция это отлично, цены падают у всех, но хоронить кого-то рановато
Re: DeepSeek R2 вышел: бенчи на уровне топов, цена в 20 раз ниже. Кто уже щупал?
✔ Лучший ответ — сформирован автоматически
не сходится. веса открытые, на опенроутере их уже хостят несколько сторонних провайдеров по 2-3 бакса, и вот им-то захват рынка дипсика до лампочки, в минус ни секунды работать не будут. MoE с активными ~30B реально дешев в инференсе, вся туша на 1.2T одновременно не молотит. так что дорогие западные api это не себестоимость, это маржаGpuGuru писал(а):при цене в 2 доллара они почти наверняка торгуют в минус ради захвата рынка
Re: DeepSeek R2 вышел: бенчи на уровне топов, цена в 20 раз ниже. Кто уже щупал?
@Bill2001, а через какого провайдера гонял? под одной моделью на опенроутере сидят разные хостеры, кто-то fp8, кто-то q4, и русский у квантованных версий проседает первым. у меня на дефолтном роутинге тоже уезжала в английский посреди коммента, прибил конкретного провайдера с fp8 и стало заметно чище. так что есть шанс, что ты не модель тестил, а чей-то кривой квант
Re: DeepSeek R2 вышел: бенчи на уровне топов, цена в 20 раз ниже. Кто уже щупал?
погонял ночь на агентских задачах. тул-коллинг работает, но после ~100к контекста начинает терять инструкции из системника, прям заметно. для чата и кода огонь, в долгие агентские пайплайны пока бы не совал
Поделиться темой:
✈ Telegram
VK
- Похожие темы
Кто сейчас на конференции
Сейчас этот форум просматривают: нет зарегистрированных пользователей и 1 гость