DeepSeek открыл веса R2, лицензия MIT. API дешевле топов почти на порядок. Опять все переезжаем?

Рейтинг: 30.1% · 4 голосов
Главные новости IT и технологий: релизы, тренды индустрии, гаджеты, искусственный интеллект и обсуждение событий мира high-tech.
Ответить
Аватара пользователя
maja33
Сообщения: 38
Зарегистрирован: 12 май 2026, 10:17

DeepSeek открыл веса R2, лицензия MIT. API дешевле топов почти на порядок. Опять все переезжаем?

Сообщение maja33 »

Ночью DeepSeek выложил R2 в открытые веса под MIT. Кратко, что известно:

MoE примерно на 680B параметров, активных около 40B
на SWE-bench и математике заявляют уровень топовых западных моделей, отставание в единицы процентов
контекст 256к
API подешевел еще раз, разница с западными по токенам теперь почти на порядок

Из СНГ их API работает без танцев с бубном, что само по себе жирный плюс.

Кто уже погонял? Интересует в первую очередь агентский кодинг на длинных сессиях, R1 у меня именно там сыпался.
👍1 ❤️ 🔥2 😄 🤔
✔ Лучший ответ сформирован автоматически — k_egor_s
nodice писал(а):бенчи у китайцев традиционно подогнаны под тест это уже мантра из 2024, а не аргумент. R1 был реально рабочий, пол-СНГ на нем просидело весь 2025, потому что дешево и по коду не хуже. Я на нем коммерческие проекты делал, никто не умер. Длинные агентские циклы да, были слабее, тут не спорю, ОП правильно спрашивает именно про это. Но "подогнано под тест" говорят рефлекторно про кажд…
Перейти к ответу →
Аватара пользователя
nodice
Сообщения: 36
Зарегистрирован: 10 май 2026, 23:58

Re: DeepSeek открыл веса R2, лицензия MIT. API дешевле топов почти на порядок. Опять все переезжаем?

Сообщение nodice »

бенчи у китайцев традиционно подогнаны под тест, сколько раз уже проходили. на бумаге фронтир, а в реальной агентской сессии через 50 шагов модель забывает что делала и начинает переписывать рабочий код. посмотрим, но я бы не спешил с переездом
👍3 ❤️ 🔥 😄 🤔1
Аватара пользователя
esp32ninja
Сообщения: 12
Зарегистрирован: 18 май 2026, 20:40

Re: DeepSeek открыл веса R2, лицензия MIT. API дешевле топов почти на порядок. Опять все переезжаем?

Сообщение esp32ninja »

полные веса это 700+ гигов, дома такое не погоняешь даже в Q4. ждем дистилляты, у R1 они выходили в течение пары недель. дистилл 32B на двух 3090 у меня выдавал 25-30 токенов в секунду через vllm, для локальных задач за глаза. если R2-дистилл будет хотя бы на уровне полного R1, это праздник для всех, у кого свое железо
👍 ❤️ 🔥 😄 🤔
Аватара пользователя
k_egor_s
Сообщения: 20
Зарегистрирован: 16 май 2026, 11:11

Re: DeepSeek открыл веса R2, лицензия MIT. API дешевле топов почти на порядок. Опять все переезжаем?

Сообщение k_egor_s »

✔ Лучший ответ — сформирован автоматически
nodice писал(а):бенчи у китайцев традиционно подогнаны под тест
это уже мантра из 2024, а не аргумент. R1 был реально рабочий, пол-СНГ на нем просидело весь 2025, потому что дешево и по коду не хуже. Я на нем коммерческие проекты делал, никто не умер. Длинные агентские циклы да, были слабее, тут не спорю, ОП правильно спрашивает именно про это. Но "подогнано под тест" говорят рефлекторно про каждый их релиз, и каждый раз модель оказывается норм.
👍 ❤️1 🔥 😄 🤔1
Аватара пользователя
barbs
Сообщения: 50
Зарегистрирован: 19 май 2026, 04:16

Re: DeepSeek открыл веса R2, лицензия MIT. API дешевле топов почти на порядок. Опять все переезжаем?

Сообщение barbs »

самое интересное тут не бенчи, а экономика. после R1 западные роняли цены в течение месяца, сейчас будет то же самое. я прикинул свой пайплайн с переводами и саммари: переезд на R2 режет косты примерно втрое при том же качестве, если качество подтвердится. для пет-проектов и мелких стартапов в СНГ это вообще главная новость полугодия, а не очередные проценты на бенчах
👍 ❤️ 🔥1 😄1 🤔
Аватара пользователя
postgres2
Сообщения: 66
Зарегистрирован: 11 май 2026, 17:56

Re: DeepSeek открыл веса R2, лицензия MIT. API дешевле топов почти на порядок. Опять все переезжаем?

Сообщение postgres2 »

вопрос немного в сторону: у нас в конторе безопасники запретили дипсик в принципе, любые их API. кто-нибудь гоняет открытые веса на своем железе в проде именно из-за таких запретов? интересно, насколько это массовая история
👍 ❤️ 🔥 😄 🤔
Ответить
Поделиться темой: ✈ Telegram VK

Вернуться в «Новости технологий»

Кто сейчас на конференции

Сейчас этот форум просматривают: нет зарегистрированных пользователей и 1 гость