Gemma 4 26B от Google — стоит ли менять Mistral/Qwen или переоценённый хайп?

Bill2001 · Сообщение **Bill2001** » 29 май 2026, 17:37

Вышла Gemma 4 26B A4B (MoE, 4B активных параметров). Google заявляют что она бьёт модели намного больше по размеру. GGUF уже есть на HuggingFace через unsloth и bartowski. Кто уже потрогал — реально хороша или очередной маркетинг? Особенно интересует кодинг и работа с русским языком.

fpga_lord · Сообщение **fpga_lord** » 29 май 2026, 19:57

Потестил неделю на кодинге (Python, TypeScript). Против Qwen3.6 27B dense проигрывает на сложных рефакторингах и архитектурных вопросах. Против Qwen3.6 35B-A3B держится достойно и влезает в меньше VRAM (~14GB против 21GB для MoE). По скорости 26B A4B шустрый — 45-50 tok/s на 4090.

k8s_master · Сообщение **k8s_master** » 30 май 2026, 04:09

Русский язык у Gemma 4 заметно лучше предыдущих версий, но Qwen3 всё ещё впереди на CIS-локали. Видно что Google учились на западных датасетах, и хотя русский понимает — стиль иногда деревянный, кальки с английского лезут. Для технических задач окей, для генерации текста под российскую аудиторию лучше Qwen.

nodice · Сообщение **nodice** » 30 май 2026, 04:26

Главный плюс Gemma 4 — QAT (quantization-aware training). Модель специально обучена так чтобы хорошо работать в квантизованном виде. Q4_K_M почти не теряет по сравнению с BF16, что для Google — честное заявление в отличие от многих других. Если VRAM ограничен и хочешь предсказуемость — Gemma 4 хороший выбор.

thumper416 · Сообщение **thumper416** » 30 май 2026, 07:41

Запустил через Ollama командой ollama pull gemma4:27b — всё подтянулось само, работает из коробки. Для тех кто не хочет возиться с GGUF руками — удобно. Но версия в Ollama немного отстаёт от свежих квантизаций на HF.

juniorghost · Сообщение **juniorghost** » 30 май 2026, 11:01

По мне хайп умеренный, не завышенный. Модель реально хорошая для своего размера. Но «бьёт модели намного больше» — это маркетинговые условия теста. На практике Qwen3.6 35B-A3B при похожем потреблении VRAM даст больше на большинстве задач. Gemma 4 26B — хороший выбор если не хочешь MoE-головняк с настройкой.

nixos69 · Сообщение **nixos69** » 10 июн 2026, 15:34

Гонял её две недели на 3090 в llama.cpp, Q4_K_M от bartowski. На суммаризации и RAG по русскоязычной документации держится отлично, после 16k контекста не разваливается — Mistral Small 24B у меня к этому моменту уже начинал терять инструкции из системного промпта. Кодинг средний: питон нормально, но на TypeScript с дженериками и перегрузками путается. Итог такой: Qwen менять смысла не вижу, а вот Mistral Small она у меня вытеснила полностью.

regex4 · Сообщение **regex4** » 10 июн 2026, 16:39

@nodice, про QAT подтверждаю цифрами: прогнал perplexity на своём корпусе — разница между Q4_K_M и Q8_0 в пределах процента, тогда как у Qwen3.6 на том же кванте просадка заметно жирнее. Для карт на 12-16 гигов это реально меняет расклад: берёшь Q4 и не гадаешь, где модель отупела от квантования, а где она сама по себе такая.

lentyaj · Сообщение **lentyaj** » 10 июн 2026, 16:41

@k8s_master, про деревянный русский соглашусь наполовину. Кальки лезут в основном в свободной генерации, а если дать жёсткий каркас — тон, пара примеров фраз в системном промпте — пишет вполне живо. Но согласование в длинных перечислениях она всё же иногда роняет, Qwen3 такого почти не делает. Для техдоки хватает, тексты «на публику» — только с редактурой руками.

Gemma 4 26B от Google — стоит ли менять Mistral/Qwen или переоценённый хайп?

Gemma 4 26B от Google — стоит ли менять Mistral/Qwen или переоценённый хайп?

Re: Gemma 4 26B от Google — стоит ли менять Mistral/Qwen или переоценённый хайп?

Re: Gemma 4 26B от Google — стоит ли менять Mistral/Qwen или переоценённый хайп?

Re: Gemma 4 26B от Google — стоит ли менять Mistral/Qwen или переоценённый хайп?

Re: Gemma 4 26B от Google — стоит ли менять Mistral/Qwen или переоценённый хайп?

Re: Gemma 4 26B от Google — стоит ли менять Mistral/Qwen или переоценённый хайп?

Re: Gemma 4 26B от Google — стоит ли менять Mistral/Qwen или переоценённый хайп?

Re: Gemma 4 26B от Google — стоит ли менять Mistral/Qwen или переоценённый хайп?

Re: Gemma 4 26B от Google — стоит ли менять Mistral/Qwen или переоценённый хайп?

Кто сейчас на конференции