DeepSeek выложила R2: открытые веса уровня западных топов, цены на токены снова летят вниз
Рейтинг: 34.2% · 2 голосов
Войдите, чтобы голосовать
Голосовать «За» и «Против» могут только авторизованные пользователи. Войдите в свой аккаунт — или зарегистрируйтесь, это займёт минуту.
Нет аккаунта? Зарегистрироваться
DeepSeek выложила R2: открытые веса уровня западных топов, цены на токены снова летят вниз
Свершилось то, чего ждали с прошлой весны: DeepSeek выпустила R2. Коротко, что известно.
Reasoning-модель, в бенчах по коду и математике идёт вровень с последними флагманами OpenAI и Google, местами обходит. Веса открыты, лицензия MIT, как у R1. API дешевле западных аналогов почти на порядок: вход около 0.3 доллара за миллион токенов, выход около 1.2. Архитектура MoE, активных параметров заметно меньше общего размера — отсюда и экономика.
Хостеры уже начали ронять цены на инференс, у западных вендоров опять неловкая пауза, как в январе 2025-го после R1.
Для нас вопрос практический: у кого западные API через прокладки и с юридическими танцами — это шанс пересесть на самохост? Кто уже щупал?
Reasoning-модель, в бенчах по коду и математике идёт вровень с последними флагманами OpenAI и Google, местами обходит. Веса открыты, лицензия MIT, как у R1. API дешевле западных аналогов почти на порядок: вход около 0.3 доллара за миллион токенов, выход около 1.2. Архитектура MoE, активных параметров заметно меньше общего размера — отсюда и экономика.
Хостеры уже начали ронять цены на инференс, у западных вендоров опять неловкая пауза, как в январе 2025-го после R1.
Для нас вопрос практический: у кого западные API через прокладки и с юридическими танцами — это шанс пересесть на самохост? Кто уже щупал?
✔ Лучший ответ сформирован автоматически — remotepanic
@ransome, Успел пощупать, делюсь приземлённой реальностью. Полная модель — это сотни гигабайт весов даже в квантованном виде, дома её не запустить: нужна стойка с H100 либо офлоад MoE-слоёв в оперативку, который превращает инференс в слайд-шоу. Все разговоры «запущу на своей 4090» — это про дистилляты. Дистиллят на 32 миллиарда в кванте Q4 влез в одну 4090 и выдаёт около 35 токенов в секунду. Для…
Re: DeepSeek выложила R2: открытые веса уровня западных топов, цены на токены снова летят вниз
Для корпоративного сегмента в РФ это главная новость года. У нас в банке любые внешние API под запретом, безопасники не пропускают даже через посредников. Открытые веса под MIT означают, что можно развернуть модель в своём контуре и закрыть вопрос. С R1 так уже делали, но качества не хватало для сложных агентских сценариев. Если R2 реально дотягивает до западных топов — внедрение согласуют без боя.
Re: DeepSeek выложила R2: открытые веса уровня западных топов, цены на токены снова летят вниз
Притормозите с восторгами. У китайских релизов стабильная картина: на публичных бенчах красота, в реальных задачах на длинном контексте начинается деградация, а tool calling в многошаговых агентах сыпется там, где западные модели едут спокойно. С R1 было ровно так. Подожду пару недель независимых замеров на живых задачах, а не маркетинговых табличек.
- remotepanic
- Сообщения: 11
- Зарегистрирован: 19 май 2026, 10:04
Re: DeepSeek выложила R2: открытые веса уровня западных топов, цены на токены снова летят вниз
✔ Лучший ответ — сформирован автоматически
@ransome, Успел пощупать, делюсь приземлённой реальностью.
Полная модель — это сотни гигабайт весов даже в квантованном виде, дома её не запустить: нужна стойка с H100 либо офлоад MoE-слоёв в оперативку, который превращает инференс в слайд-шоу. Все разговоры «запущу на своей 4090» — это про дистилляты.
Дистиллят на 32 миллиарда в кванте Q4 влез в одну 4090 и выдаёт около 35 токенов в секунду. Для код-ассиста в IDE — честно хорошо, уровень моделей, за которые год назад платили как за облако. Русский язык у дистиллята заметно слабее английского, в цепочках рассуждений иногда проскакивает китайский — лечится системным промптом.
API погонял на рабочем пайплайне разбора документов: качество сопоставимо с западной моделью, которую используем сейчас, а счёт за день тестов — меньше доллара против обычных двадцати. Если на проде подтвердится, миграция окупится за неделю.
Полная модель — это сотни гигабайт весов даже в квантованном виде, дома её не запустить: нужна стойка с H100 либо офлоад MoE-слоёв в оперативку, который превращает инференс в слайд-шоу. Все разговоры «запущу на своей 4090» — это про дистилляты.
Дистиллят на 32 миллиарда в кванте Q4 влез в одну 4090 и выдаёт около 35 токенов в секунду. Для код-ассиста в IDE — честно хорошо, уровень моделей, за которые год назад платили как за облако. Русский язык у дистиллята заметно слабее английского, в цепочках рассуждений иногда проскакивает китайский — лечится системным промптом.
API погонял на рабочем пайплайне разбора документов: качество сопоставимо с западной моделью, которую используем сейчас, а счёт за день тестов — меньше доллара против обычных двадцати. Если на проде подтвердится, миграция окупится за неделю.
Re: DeepSeek выложила R2: открытые веса уровня западных топов, цены на токены снова летят вниз
Интересно, как ответят Сбер и Яндекс. GigaChat и YandexGPT продаются корпоратам в основном через аргументы «данные в РФ» и соответствие 152-ФЗ, по качеству до западных топов они и не дотягивались. Теперь появляется вариант: открытая модель мирового уровня в собственном контуре — и данные никуда не уходят, и качество выше. Остаётся аргумент «поддержка и сертификаты», посмотрим, на сколько его хватит.
Поделиться темой:
✈ Telegram
VK
- Похожие темы
-
-
-
-
- DeepSeek R2 вышел: бенчи на уровне топов, цена в 20 раз ниже. Кто уже щупал?
7 ответов · 6 просмотров
-
- DeepSeek выложил веса V4 под MIT: заявляют уровень фронтира при цене API в разы ниже. Кто уже щупал?
4 ответов · 4 просмотров
-
Кто сейчас на конференции
Сейчас этот форум просматривают: нет зарегистрированных пользователей и 1 гость