Qwen3.5 вышел, мелкий MoE 42B-A6B выглядит как новый домашний дефолт

danga · Сообщение **danga** » 20 май 2026, 11:47

Ночью квены выложили Qwen3.5. В линейке 42B-A6B, 120B-A12B и здоровенный 480B-A35B. Интересен мелкий: 42 ярда общих, 6 активных, заявлен нативный контекст 256к и гибридное внимание как в Next, kv-кэш на длинном контексте почти не растет.

ggufы от unsloth уже лежат. Взял UD-Q4_K_XL на 24 гига, на 3090 с выгрузкой половины экспертов в RAM едет 31-33 t/s. На моих питоновских задачах примерно уровень старого 30B-A3B, но контекст держит заметно лучше. На 60к токенов кода еще не плывет, старый на 32к уже начинал выдумывать имена функций.

Официальные бенчи пересказывать не буду, там как обычно все победили всех.

coder_anton · Сообщение **coder_anton** » 20 май 2026, 15:59

@danga, бенчи у квена последний год рисованые чуть более чем полностью. после релиза, где они в таблицах рвали клода, а на деле модель путалась в трех строках sql, веры ноль. подожду неделю реальных отзывов, потом качну

Tcraw62981 · Сообщение **Tcraw62981** » 20 май 2026, 16:26

а в ollama уже завезли?

nicky21 · Сообщение **nicky21** » 20 май 2026, 16:42

@danga, хах, этажом выше висит тред про то, почему олламу пора закопать, и тут ты. gguf с hf плюс llama-server это одна команда, ну. по теме: погонял 42B на агентских тасках, tool calling стал ощутимо стабильнее, json почти не ломает. для 6 активных ярдов прям достойно

roman2026 · Сообщение **roman2026** » 20 май 2026, 19:59

coder_anton писал(а):бенчи у квена последний год рисованые чуть более чем полностью

рисованые у всех, квен тут не уникален. только модели у них при этом рабочие, 30B-A3B весь прошлый год был дефолтом у половины этого раздела. таблицы игнорируй и гоняй на своих тасках. и чем тебе поможет неделя ожидания, чужие отзывы такие же кривые, как бенчи, только еще и на чужих задачах

deno9 · Сообщение **deno9** » 20 май 2026, 23:16

danga писал(а):На 60к токенов кода еще не плывет

а чем мерял, что не плывет? если просто спросил про функцию из начала файла, это needle in haystack, его сейчас все проходят. попроси найти противоречие между куском из начала и из середины, вот там обычно и сыпятся. заявленные 256к у локалок пока маркетинг, честных 100к я еще ни у кого не видел

Qwen3.5 вышел, мелкий MoE 42B-A6B выглядит как новый домашний дефолт

Qwen3.5 вышел, мелкий MoE 42B-A6B выглядит как новый домашний дефолт

Re: Qwen3.5 вышел, мелкий MoE 42B-A6B выглядит как новый домашний дефолт

Re: Qwen3.5 вышел, мелкий MoE 42B-A6B выглядит как новый домашний дефолт

Re: Qwen3.5 вышел, мелкий MoE 42B-A6B выглядит как новый домашний дефолт

Re: Qwen3.5 вышел, мелкий MoE 42B-A6B выглядит как новый домашний дефолт

Re: Qwen3.5 вышел, мелкий MoE 42B-A6B выглядит как новый домашний дефолт

Кто сейчас на конференции