DeepSeek выложила R2: открытые веса уровня западных топов, цены на токены снова летят вниз

Рейтинг: 34.2% · 2 голосов
Главные новости IT и технологий: релизы, тренды индустрии, гаджеты, искусственный интеллект и обсуждение событий мира high-tech.
Ответить
Аватара пользователя
idlebteam
Сообщения: 28
Зарегистрирован: 17 май 2026, 03:14

DeepSeek выложила R2: открытые веса уровня западных топов, цены на токены снова летят вниз

Сообщение idlebteam »

Свершилось то, чего ждали с прошлой весны: DeepSeek выпустила R2. Коротко, что известно.

Reasoning-модель, в бенчах по коду и математике идёт вровень с последними флагманами OpenAI и Google, местами обходит. Веса открыты, лицензия MIT, как у R1. API дешевле западных аналогов почти на порядок: вход около 0.3 доллара за миллион токенов, выход около 1.2. Архитектура MoE, активных параметров заметно меньше общего размера — отсюда и экономика.

Хостеры уже начали ронять цены на инференс, у западных вендоров опять неловкая пауза, как в январе 2025-го после R1.

Для нас вопрос практический: у кого западные API через прокладки и с юридическими танцами — это шанс пересесть на самохост? Кто уже щупал?
👍2 ❤️1 🔥1 😄2 🤔
✔ Лучший ответ сформирован автоматически — remotepanic
@ransome, Успел пощупать, делюсь приземлённой реальностью. Полная модель — это сотни гигабайт весов даже в квантованном виде, дома её не запустить: нужна стойка с H100 либо офлоад MoE-слоёв в оперативку, который превращает инференс в слайд-шоу. Все разговоры «запущу на своей 4090» — это про дистилляты. Дистиллят на 32 миллиарда в кванте Q4 влез в одну 4090 и выдаёт около 35 токенов в секунду. Для…
Перейти к ответу →
Аватара пользователя
ransome
Сообщения: 37
Зарегистрирован: 11 май 2026, 01:39

Re: DeepSeek выложила R2: открытые веса уровня западных топов, цены на токены снова летят вниз

Сообщение ransome »

Для корпоративного сегмента в РФ это главная новость года. У нас в банке любые внешние API под запретом, безопасники не пропускают даже через посредников. Открытые веса под MIT означают, что можно развернуть модель в своём контуре и закрыть вопрос. С R1 так уже делали, но качества не хватало для сложных агентских сценариев. Если R2 реально дотягивает до западных топов — внедрение согласуют без боя.
👍 ❤️ 🔥2 😄 🤔
Аватара пользователя
omnicrom
Сообщения: 32
Зарегистрирован: 11 май 2026, 07:08

Re: DeepSeek выложила R2: открытые веса уровня западных топов, цены на токены снова летят вниз

Сообщение omnicrom »

Притормозите с восторгами. У китайских релизов стабильная картина: на публичных бенчах красота, в реальных задачах на длинном контексте начинается деградация, а tool calling в многошаговых агентах сыпется там, где западные модели едут спокойно. С R1 было ровно так. Подожду пару недель независимых замеров на живых задачах, а не маркетинговых табличек.
👍 ❤️ 🔥 😄1 🤔1
Аватара пользователя
remotepanic
Сообщения: 11
Зарегистрирован: 19 май 2026, 10:04

Re: DeepSeek выложила R2: открытые веса уровня западных топов, цены на токены снова летят вниз

Сообщение remotepanic »

✔ Лучший ответ — сформирован автоматически
@ransome, Успел пощупать, делюсь приземлённой реальностью.

Полная модель — это сотни гигабайт весов даже в квантованном виде, дома её не запустить: нужна стойка с H100 либо офлоад MoE-слоёв в оперативку, который превращает инференс в слайд-шоу. Все разговоры «запущу на своей 4090» — это про дистилляты.

Дистиллят на 32 миллиарда в кванте Q4 влез в одну 4090 и выдаёт около 35 токенов в секунду. Для код-ассиста в IDE — честно хорошо, уровень моделей, за которые год назад платили как за облако. Русский язык у дистиллята заметно слабее английского, в цепочках рассуждений иногда проскакивает китайский — лечится системным промптом.

API погонял на рабочем пайплайне разбора документов: качество сопоставимо с западной моделью, которую используем сейчас, а счёт за день тестов — меньше доллара против обычных двадцати. Если на проде подтвердится, миграция окупится за неделю.
👍2 ❤️1 🔥 😄 🤔
Аватара пользователя
infern
Сообщения: 87
Зарегистрирован: 11 май 2026, 10:23

Re: DeepSeek выложила R2: открытые веса уровня западных топов, цены на токены снова летят вниз

Сообщение infern »

Интересно, как ответят Сбер и Яндекс. GigaChat и YandexGPT продаются корпоратам в основном через аргументы «данные в РФ» и соответствие 152-ФЗ, по качеству до западных топов они и не дотягивались. Теперь появляется вариант: открытая модель мирового уровня в собственном контуре — и данные никуда не уходят, и качество выше. Остаётся аргумент «поддержка и сертификаты», посмотрим, на сколько его хватит.
👍 ❤️ 🔥 😄 🤔
Аватара пользователя
kend212
Сообщения: 4
Зарегистрирован: 19 май 2026, 11:55

Re: DeepSeek выложила R2: открытые веса уровня западных топов, цены на токены снова летят вниз

Сообщение kend212 »

Акции Nvidia опять колбасит, всё по классике. Январь 2025-го показал, что рынок реагирует на DeepSeek нервнее, чем на отчёты самих вендоров. Запасаемся попкорном и дешёвыми токенами.
👍 ❤️1 🔥 😄 🤔
Ответить
Поделиться темой: ✈ Telegram VK

Вернуться в «Новости технологий»

Кто сейчас на конференции

Сейчас этот форум просматривают: нет зарегистрированных пользователей и 1 гость