Gemma 4 26B от Google — стоит ли менять Mistral/Qwen или переоценённый хайп?

Рейтинг: 43.9% · 3 голосов
Запуск больших языковых моделей локально: Llama, Mistral, Qwen, DeepSeek, Gemma. Квантизация GGUF, Ollama, llama.cpp, vLLM, LM Studio, выбор GPU и оптимизация инференса.
Ответить
Аватара пользователя
yaroslav_hex
Сообщения: 5
Зарегистрирован: Пн май 11, 2026 11:37 pm

Gemma 4 26B от Google — стоит ли менять Mistral/Qwen или переоценённый хайп?

Сообщение yaroslav_hex »

Вышла Gemma 4 26B A4B (MoE, 4B активных параметров). Google заявляют что она бьёт модели намного больше по размеру. GGUF уже есть на HuggingFace через unsloth и bartowski. Кто уже потрогал — реально хороша или очередной маркетинг? Особенно интересует кодинг и работа с русским языком.
👍3 ❤️ 🔥 😄1 🤔
✔ Лучший ответ сформирован автоматически — kotik2000
Русский язык у Gemma 4 заметно лучше предыдущих версий, но Qwen3 всё ещё впереди на CIS-локали. Видно что Google учились на западных датасетах, и хотя русский понимает — стиль иногда деревянный, кальки с английского лезут. Для технических задач окей, для генерации текста под российскую аудиторию лучше Qwen.
Перейти к ответу →
Аватара пользователя
vuenet6816
Сообщения: 7
Зарегистрирован: Пн май 11, 2026 2:57 am

Re: Gemma 4 26B от Google — стоит ли менять Mistral/Qwen или переоценённый хайп?

Сообщение vuenet6816 »

Потестил неделю на кодинге (Python, TypeScript). Против Qwen3.6 27B dense проигрывает на сложных рефакторингах и архитектурных вопросах. Против Qwen3.6 35B-A3B держится достойно и влезает в меньше VRAM (~14GB против 21GB для MoE). По скорости 26B A4B шустрый — 45-50 tok/s на 4090.
👍 ❤️2 🔥 😄 🤔
Аватара пользователя
kotik2000
Сообщения: 5
Зарегистрирован: Ср май 13, 2026 2:05 am
Репутация: 68

Re: Gemma 4 26B от Google — стоит ли менять Mistral/Qwen или переоценённый хайп?

Сообщение kotik2000 »

✔ Лучший ответ — сформирован автоматически
Русский язык у Gemma 4 заметно лучше предыдущих версий, но Qwen3 всё ещё впереди на CIS-локали. Видно что Google учились на западных датасетах, и хотя русский понимает — стиль иногда деревянный, кальки с английского лезут. Для технических задач окей, для генерации текста под российскую аудиторию лучше Qwen.
👍 ❤️ 🔥 😄1 🤔
Аватара пользователя
omegadata7864
Сообщения: 15
Зарегистрирован: Ср май 13, 2026 5:39 am

Re: Gemma 4 26B от Google — стоит ли менять Mistral/Qwen или переоценённый хайп?

Сообщение omegadata7864 »

Главный плюс Gemma 4 — QAT (quantization-aware training). Модель специально обучена так чтобы хорошо работать в квантизованном виде. Q4_K_M почти не теряет по сравнению с BF16, что для Google — честное заявление в отличие от многих других. Если VRAM ограничен и хочешь предсказуемость — Gemma 4 хороший выбор.
👍 ❤️ 🔥 😄1 🤔
Аватара пользователя
yaroslav_neon8
Сообщения: 2
Зарегистрирован: Ср май 20, 2026 1:21 pm

Re: Gemma 4 26B от Google — стоит ли менять Mistral/Qwen или переоценённый хайп?

Сообщение yaroslav_neon8 »

Запустил через Ollama командой ollama pull gemma4:27b — всё подтянулось само, работает из коробки. Для тех кто не хочет возиться с GGUF руками — удобно. Но версия в Ollama немного отстаёт от свежих квантизаций на HF.
👍 ❤️1 🔥 😄 🤔
Аватара пользователя
artem_node41
Сообщения: 16
Зарегистрирован: Пн май 11, 2026 11:48 pm

Re: Gemma 4 26B от Google — стоит ли менять Mistral/Qwen или переоценённый хайп?

Сообщение artem_node41 »

По мне хайп умеренный, не завышенный. Модель реально хорошая для своего размера. Но «бьёт модели намного больше» — это маркетинговые условия теста. На практике Qwen3.6 35B-A3B при похожем потреблении VRAM даст больше на большинстве задач. Gemma 4 26B — хороший выбор если не хочешь MoE-головняк с настройкой.
👍2 ❤️ 🔥 😄 🤔
Ответить
Поделиться темой: ✈ Telegram VK

Вернуться в «Локальные LLM и open-source модели»

Кто сейчас на конференции

Сейчас этот форум просматривают: нет зарегистрированных пользователей и 1 гость