DeepSeek выложила R2: открытые веса уровня западных топов, цены на токены снова летят вниз

idlebteam · Сообщение **idlebteam** » 09 июн 2026, 15:23

Свершилось то, чего ждали с прошлой весны: DeepSeek выпустила R2. Коротко, что известно.

Reasoning-модель, в бенчах по коду и математике идёт вровень с последними флагманами OpenAI и Google, местами обходит. Веса открыты, лицензия MIT, как у R1. API дешевле западных аналогов почти на порядок: вход около 0.3 доллара за миллион токенов, выход около 1.2. Архитектура MoE, активных параметров заметно меньше общего размера — отсюда и экономика.

Хостеры уже начали ронять цены на инференс, у западных вендоров опять неловкая пауза, как в январе 2025-го после R1.

Для нас вопрос практический: у кого западные API через прокладки и с юридическими танцами — это шанс пересесть на самохост? Кто уже щупал?

ransome · Сообщение **ransome** » 09 июн 2026, 19:16

Для корпоративного сегмента в РФ это главная новость года. У нас в банке любые внешние API под запретом, безопасники не пропускают даже через посредников. Открытые веса под MIT означают, что можно развернуть модель в своём контуре и закрыть вопрос. С R1 так уже делали, но качества не хватало для сложных агентских сценариев. Если R2 реально дотягивает до западных топов — внедрение согласуют без боя.

omnicrom · Сообщение **omnicrom** » 09 июн 2026, 23:35

Притормозите с восторгами. У китайских релизов стабильная картина: на публичных бенчах красота, в реальных задачах на длинном контексте начинается деградация, а tool calling в многошаговых агентах сыпется там, где западные модели едут спокойно. С R1 было ровно так. Подожду пару недель независимых замеров на живых задачах, а не маркетинговых табличек.

remotepanic · Сообщение **remotepanic** » 10 июн 2026, 03:16

@ransome, Успел пощупать, делюсь приземлённой реальностью.

Полная модель — это сотни гигабайт весов даже в квантованном виде, дома её не запустить: нужна стойка с H100 либо офлоад MoE-слоёв в оперативку, который превращает инференс в слайд-шоу. Все разговоры «запущу на своей 4090» — это про дистилляты.

Дистиллят на 32 миллиарда в кванте Q4 влез в одну 4090 и выдаёт около 35 токенов в секунду. Для код-ассиста в IDE — честно хорошо, уровень моделей, за которые год назад платили как за облако. Русский язык у дистиллята заметно слабее английского, в цепочках рассуждений иногда проскакивает китайский — лечится системным промптом.

API погонял на рабочем пайплайне разбора документов: качество сопоставимо с западной моделью, которую используем сейчас, а счёт за день тестов — меньше доллара против обычных двадцати. Если на проде подтвердится, миграция окупится за неделю.

infern · Сообщение **infern** » 10 июн 2026, 07:56

Интересно, как ответят Сбер и Яндекс. GigaChat и YandexGPT продаются корпоратам в основном через аргументы «данные в РФ» и соответствие 152-ФЗ, по качеству до западных топов они и не дотягивались. Теперь появляется вариант: открытая модель мирового уровня в собственном контуре — и данные никуда не уходят, и качество выше. Остаётся аргумент «поддержка и сертификаты», посмотрим, на сколько его хватит.

kend212 · Сообщение **kend212** » 10 июн 2026, 08:19

Акции Nvidia опять колбасит, всё по классике. Январь 2025-го показал, что рынок реагирует на DeepSeek нервнее, чем на отчёты самих вендоров. Запасаемся попкорном и дешёвыми токенами.

DeepSeek выложила R2: открытые веса уровня западных топов, цены на токены снова летят вниз

DeepSeek выложила R2: открытые веса уровня западных топов, цены на токены снова летят вниз

Re: DeepSeek выложила R2: открытые веса уровня западных топов, цены на токены снова летят вниз

Re: DeepSeek выложила R2: открытые веса уровня западных топов, цены на токены снова летят вниз

Re: DeepSeek выложила R2: открытые веса уровня западных топов, цены на токены снова летят вниз

Re: DeepSeek выложила R2: открытые веса уровня западных топов, цены на токены снова летят вниз

Re: DeepSeek выложила R2: открытые веса уровня западных топов, цены на токены снова летят вниз

Кто сейчас на конференции