70B в IQ2_XXS против 14B в Q6, кто на самом деле умнее
Рейтинг: 43.9% · 3 голосов
Войдите, чтобы голосовать
Голосовать «За» и «Против» могут только авторизованные пользователи. Войдите в свой аккаунт — или зарегистрируйтесь, это займёт минуту.
Нет аккаунта? Зарегистрироваться
70B в IQ2_XXS против 14B в Q6, кто на самом деле умнее
Надоели теоретические споры, прогнал сам. Дано: одна 3090. Кандидаты: Llama-3.3-70B в IQ2_XXS (влазит целиком, 19.5 гига) и Qwen3-14B в Q6_K. Тесты свои, 30 заданий: код на питоне, логика, суммаризация на русском, длинный диалог на 40 сообщений.
Результаты меня удивили. В коде 14B Q6 рвет, 70B в этом кванте путает аргументы функций и один раз выдала питон вперемешку с js. А вот в длинном диалоге наоборот, 70B даже лоботомированная держит нить и помнит что было 30 сообщений назад, 14B к концу плывет. Суммаризация примерно поровну.
Вывод у меня такой: для кода и точных задач квант важнее размера, для болтовни и удержания контекста размер важнее кванта. Кидайте помидоры.
Результаты меня удивили. В коде 14B Q6 рвет, 70B в этом кванте путает аргументы функций и один раз выдала питон вперемешку с js. А вот в длинном диалоге наоборот, 70B даже лоботомированная держит нить и помнит что было 30 сообщений назад, 14B к концу плывет. Суммаризация примерно поровну.
Вывод у меня такой: для кода и точных задач квант важнее размера, для болтовни и удержания контекста размер важнее кванта. Кидайте помидоры.
- nginxsmith
- Сообщения: 12
- Зарегистрирован: 11 май 2026, 11:07
Поделиться темой:
✈ Telegram
VK
- Похожие темы
-
-
-
-
-
- Доверяете ли вы агенту коммитить и пушить самому? Где ваша красная линия
10 ответов · 569 просмотров
-
- Воздух против AIO в 2026: есть ли вообще смысл в водянке для домашнего ПК?
11 ответов · 492 просмотров
Кто сейчас на конференции
Сейчас этот форум просматривают: нет зарегистрированных пользователей и 1 гость