DeepSeek открыл веса R2, лицензия MIT. API дешевле топов почти на порядок. Опять все переезжаем?
Рейтинг: 30.1% · 4 голосов
Войдите, чтобы голосовать
Голосовать «За» и «Против» могут только авторизованные пользователи. Войдите в свой аккаунт — или зарегистрируйтесь, это займёт минуту.
Нет аккаунта? Зарегистрироваться
DeepSeek открыл веса R2, лицензия MIT. API дешевле топов почти на порядок. Опять все переезжаем?
Ночью DeepSeek выложил R2 в открытые веса под MIT. Кратко, что известно:
MoE примерно на 680B параметров, активных около 40B
на SWE-bench и математике заявляют уровень топовых западных моделей, отставание в единицы процентов
контекст 256к
API подешевел еще раз, разница с западными по токенам теперь почти на порядок
Из СНГ их API работает без танцев с бубном, что само по себе жирный плюс.
Кто уже погонял? Интересует в первую очередь агентский кодинг на длинных сессиях, R1 у меня именно там сыпался.
MoE примерно на 680B параметров, активных около 40B
на SWE-bench и математике заявляют уровень топовых западных моделей, отставание в единицы процентов
контекст 256к
API подешевел еще раз, разница с западными по токенам теперь почти на порядок
Из СНГ их API работает без танцев с бубном, что само по себе жирный плюс.
Кто уже погонял? Интересует в первую очередь агентский кодинг на длинных сессиях, R1 у меня именно там сыпался.
✔ Лучший ответ сформирован автоматически — k_egor_s
nodice писал(а):бенчи у китайцев традиционно подогнаны под тест это уже мантра из 2024, а не аргумент. R1 был реально рабочий, пол-СНГ на нем просидело весь 2025, потому что дешево и по коду не хуже. Я на нем коммерческие проекты делал, никто не умер. Длинные агентские циклы да, были слабее, тут не спорю, ОП правильно спрашивает именно про это. Но "подогнано под тест" говорят рефлекторно про кажд…
Re: DeepSeek открыл веса R2, лицензия MIT. API дешевле топов почти на порядок. Опять все переезжаем?
бенчи у китайцев традиционно подогнаны под тест, сколько раз уже проходили. на бумаге фронтир, а в реальной агентской сессии через 50 шагов модель забывает что делала и начинает переписывать рабочий код. посмотрим, но я бы не спешил с переездом
- esp32ninja
- Сообщения: 12
- Зарегистрирован: 18 май 2026, 20:40
Re: DeepSeek открыл веса R2, лицензия MIT. API дешевле топов почти на порядок. Опять все переезжаем?
полные веса это 700+ гигов, дома такое не погоняешь даже в Q4. ждем дистилляты, у R1 они выходили в течение пары недель. дистилл 32B на двух 3090 у меня выдавал 25-30 токенов в секунду через vllm, для локальных задач за глаза. если R2-дистилл будет хотя бы на уровне полного R1, это праздник для всех, у кого свое железо
Re: DeepSeek открыл веса R2, лицензия MIT. API дешевле топов почти на порядок. Опять все переезжаем?
✔ Лучший ответ — сформирован автоматически
это уже мантра из 2024, а не аргумент. R1 был реально рабочий, пол-СНГ на нем просидело весь 2025, потому что дешево и по коду не хуже. Я на нем коммерческие проекты делал, никто не умер. Длинные агентские циклы да, были слабее, тут не спорю, ОП правильно спрашивает именно про это. Но "подогнано под тест" говорят рефлекторно про каждый их релиз, и каждый раз модель оказывается норм.nodice писал(а):бенчи у китайцев традиционно подогнаны под тест
Re: DeepSeek открыл веса R2, лицензия MIT. API дешевле топов почти на порядок. Опять все переезжаем?
самое интересное тут не бенчи, а экономика. после R1 западные роняли цены в течение месяца, сейчас будет то же самое. я прикинул свой пайплайн с переводами и саммари: переезд на R2 режет косты примерно втрое при том же качестве, если качество подтвердится. для пет-проектов и мелких стартапов в СНГ это вообще главная новость полугодия, а не очередные проценты на бенчах
Re: DeepSeek открыл веса R2, лицензия MIT. API дешевле топов почти на порядок. Опять все переезжаем?
вопрос немного в сторону: у нас в конторе безопасники запретили дипсик в принципе, любые их API. кто-нибудь гоняет открытые веса на своем железе в проде именно из-за таких запретов? интересно, насколько это массовая история
Поделиться темой:
✈ Telegram
VK
- Похожие темы
-
-
-
- Serverless — это всё ещё хайп или реально дешевле? Посчитал Lambda vs обычный контейнер
8 ответов · 363 просмотров
-
-
- Pi 5 в рознице под 14 тысяч — переезжаем с Home Assistant на тонкий клиент с Авито?
5 ответов · 9 просмотров
-
- Hetzner vs Selectel 2026 — где дешевле держать нагруженный PostgreSQL в облаке?
4 ответов · 6 просмотров
Кто сейчас на конференции
Сейчас этот форум просматривают: нет зарегистрированных пользователей и 1 гость