Qwen3.5 вышел, мелкий MoE 42B-A6B выглядит как новый домашний дефолт

Рейтинг: 43.9% · 3 голосов
Запуск больших языковых моделей локально: Llama, Mistral, Qwen, DeepSeek, Gemma. Квантизация GGUF, Ollama, llama.cpp, vLLM, LM Studio, выбор GPU и оптимизация инференса.
Ответить
Аватара пользователя
danga
Сообщения: 18
Зарегистрирован: 17 май 2026, 16:34

Qwen3.5 вышел, мелкий MoE 42B-A6B выглядит как новый домашний дефолт

Сообщение danga »

Ночью квены выложили Qwen3.5. В линейке 42B-A6B, 120B-A12B и здоровенный 480B-A35B. Интересен мелкий: 42 ярда общих, 6 активных, заявлен нативный контекст 256к и гибридное внимание как в Next, kv-кэш на длинном контексте почти не растет.

ggufы от unsloth уже лежат. Взял UD-Q4_K_XL на 24 гига, на 3090 с выгрузкой половины экспертов в RAM едет 31-33 t/s. На моих питоновских задачах примерно уровень старого 30B-A3B, но контекст держит заметно лучше. На 60к токенов кода еще не плывет, старый на 32к уже начинал выдумывать имена функций.

Официальные бенчи пересказывать не буду, там как обычно все победили всех.
👍 ❤️2 🔥1 😄1 🤔
✔ Лучший ответ сформирован автоматически — roman2026
coder_anton писал(а):бенчи у квена последний год рисованые чуть более чем полностью рисованые у всех, квен тут не уникален. только модели у них при этом рабочие, 30B-A3B весь прошлый год был дефолтом у половины этого раздела. таблицы игнорируй и гоняй на своих тасках. и чем тебе поможет неделя ожидания, чужие отзывы такие же кривые, как бенчи, только еще и на чужих задачах
Перейти к ответу →
Аватара пользователя
coder_anton
Сообщения: 32
Зарегистрирован: 11 май 2026, 16:50

Re: Qwen3.5 вышел, мелкий MoE 42B-A6B выглядит как новый домашний дефолт

Сообщение coder_anton »

@danga, бенчи у квена последний год рисованые чуть более чем полностью. после релиза, где они в таблицах рвали клода, а на деле модель путалась в трех строках sql, веры ноль. подожду неделю реальных отзывов, потом качну
👍 ❤️ 🔥 😄 🤔
Аватара пользователя
nicky21
Сообщения: 20
Зарегистрирован: 19 май 2026, 00:01

Re: Qwen3.5 вышел, мелкий MoE 42B-A6B выглядит как новый домашний дефолт

Сообщение nicky21 »

@danga, хах, этажом выше висит тред про то, почему олламу пора закопать, и тут ты. gguf с hf плюс llama-server это одна команда, ну. по теме: погонял 42B на агентских тасках, tool calling стал ощутимо стабильнее, json почти не ломает. для 6 активных ярдов прям достойно
👍 ❤️ 🔥 😄 🤔
Аватара пользователя
roman2026
Сообщения: 39
Зарегистрирован: 10 май 2026, 23:40

Re: Qwen3.5 вышел, мелкий MoE 42B-A6B выглядит как новый домашний дефолт

Сообщение roman2026 »

✔ Лучший ответ — сформирован автоматически
coder_anton писал(а):бенчи у квена последний год рисованые чуть более чем полностью
рисованые у всех, квен тут не уникален. только модели у них при этом рабочие, 30B-A3B весь прошлый год был дефолтом у половины этого раздела. таблицы игнорируй и гоняй на своих тасках. и чем тебе поможет неделя ожидания, чужие отзывы такие же кривые, как бенчи, только еще и на чужих задачах
👍1 ❤️1 🔥1 😄 🤔
Аватара пользователя
deno9
Сообщения: 17
Зарегистрирован: 22 май 2026, 11:52

Re: Qwen3.5 вышел, мелкий MoE 42B-A6B выглядит как новый домашний дефолт

Сообщение deno9 »

danga писал(а):На 60к токенов кода еще не плывет
а чем мерял, что не плывет? если просто спросил про функцию из начала файла, это needle in haystack, его сейчас все проходят. попроси найти противоречие между куском из начала и из середины, вот там обычно и сыпятся. заявленные 256к у локалок пока маркетинг, честных 100к я еще ни у кого не видел
👍1 ❤️1 🔥2 😄 🤔
Ответить
Поделиться темой: ✈ Telegram VK

Вернуться в «Локальные LLM и open-source модели»

Кто сейчас на конференции

Сейчас этот форум просматривают: нет зарегистрированных пользователей и 0 гостей