Купил Mac Studio M4 Max 128гб под локальные модели и немного жалею
Рейтинг: 52.9% · 8 голосов
Войдите, чтобы голосовать
Голосовать «За» и «Против» могут только авторизованные пользователи. Войдите в свой аккаунт — или зарегистрируйтесь, это займёт минуту.
Нет аккаунта? Зарегистрироваться
Купил Mac Studio M4 Max 128гб под локальные модели и немного жалею
Взял Mac Studio M4 Max на 128 гб специально под локальный инференс, потому что unified memory и можно крутить большие модели без рига из видях. Спустя месяц напишу честно где разочарование. Большие плотные модели да, влезают, Llama-3.3-70B в Q5 идёт около 9-10 т/с, для чата ок. Но промпт-процессинг это боль, на контексте 30к первого токена ждёшь чуть ли не минуту, потому что prefill на Apple GPU медленный против nvidia. И как только хочешь дообучить или хоть LoRA покрутить, упираешься в то что половина инструментов из коробки не работает, всё заточено под cuda. MLX спасает но не везде. По деньгам вышло 380к, на эти деньги риг из 3090 был бы быстрее на инференсе, хоть и шумнее и без 128 гб одним куском.
✔ Лучший ответ сформирован автоматически — kernelpilot
jodgould писал(а):мак это инференс-аплаенс а не тренировочная станция согласен с оговоркой. Как инференс-аплаенс он хорош ровно до момента пока тебе хватает скорости prefill. Кто гоняет RAG с большими документами на 50-100к контекста, тот на маке взвоет, потому что каждый запрос это пауза. Для коротких чатов и агентов с маленьким контекстом мак шикарен. Так что зависит от паттерна нагрузки, а не …
- kernelpilot
- Сообщения: 24
- Зарегистрирован: 19 май 2026, 15:38
Re: Купил Mac Studio M4 Max 128гб под локальные модели и немного жалею
✔ Лучший ответ — сформирован автоматически
согласен с оговоркой. Как инференс-аплаенс он хорош ровно до момента пока тебе хватает скорости prefill. Кто гоняет RAG с большими документами на 50-100к контекста, тот на маке взвоет, потому что каждый запрос это пауза. Для коротких чатов и агентов с маленьким контекстом мак шикарен. Так что зависит от паттерна нагрузки, а не просто инференс да или нет.jodgould писал(а):мак это инференс-аплаенс а не тренировочная станция
- nixos_andy
- Сообщения: 61
- Зарегистрирован: 11 май 2026, 03:44
Re: Купил Mac Studio M4 Max 128гб под локальные модели и немного жалею
MLX кстати сильно подтянули за 2026, Qwen3 и DeepSeek в mlx-формате идут заметно бодрее чем через llama.cpp metal. Если сидишь на маке и не юзаешь mlx, ты сам себя обкрадываешь. Конвертни веса в mlx и удивишься, у меня 70B прибавила пару т/с и prefill чуть веселее.
Поделиться темой:
✈ Telegram
VK
- Похожие темы
-
-
- Bug bounty с российским паспортом в 2026 — HackerOne, Intigriti или уходить на локальные платформы?
8 ответов · 24 просмотров
-
-
- Chronos и TimesFM против CatBoost: кто-то реально перевел прогноз спроса на foundation-модели?
5 ответов · 11 просмотров
-
- Б/у RTX 3090 за 55-60к под локальные нейронки в 2026 — авантюра или лучший вариант?
5 ответов · 10 просмотров
-
- Ryzen AI Max+ 395 со 128 ГБ приехал из Китая — замеры локальных LLM и немного боли
5 ответов · 9 просмотров
Кто сейчас на конференции
Сейчас этот форум просматривают: нет зарегистрированных пользователей и 1 гость