Mac Studio M3 Ultra 512гб под локальные LLM, окупается или развод
Рейтинг: 49% · 10 голосов
Войдите, чтобы голосовать
Голосовать «За» и «Против» могут только авторизованные пользователи. Войдите в свой аккаунт — или зарегистрируйтесь, это займёт минуту.
Нет аккаунта? Зарегистрироваться
- softlurker
- Сообщения: 23
- Зарегистрирован: 16 май 2026, 13:16
Mac Studio M3 Ultra 512гб под локальные LLM, окупается или развод
Думаю брать Mac Studio M3 Ultra с 512гб unified memory под локальные модели и хочу понять, это разумная трата ~700к рублей или маркетинговая ловушка. Плюс очевиден: 512гб общей памяти позволяют грузить DeepSeek-V3 и прочих монстров целиком, чего на консьюмерских видяхах не сделать без фермы. Минус: пропускная способность памяти у эпла хоть и высокая (~800 гбайт/с), но это не HBM, и на больших плотных моделях префилл проседает. Кто реально юзает, какие t/s на чем и не пожалели ли.
✔ Лучший ответ сформирован автоматически — postgres2
@coder_vasya, DeepSeek-V3 это 671B MoE, 37B активных. На M3 Ultra 512гб в Q4 он влезает целиком и это реально его киллер-фича, на ферме из 4090 такое целиком не уместишь без выгрузки в RAM. По цифрам с форумов: V3 на M3 Ultra дает 18-20 t/s генерации, префилл медленный но терпимый для интерактива. То есть мак оправдан ровно в одном сценарии: ты хочешь самые большие открытые MoE целиком в памяти и…
- coder_vasya
- Сообщения: 73
- Зарегистрирован: 12 май 2026, 05:35
Re: Mac Studio M3 Ultra 512гб под локальные LLM, окупается или развод
держу M2 Ultra 192гб, на 70B Q4 даю около 12 t/s генерации, префилл на длинном контексте боль, ждешь по 20-30 сек пока обработает 8к токенов. для чата ок, для агентов с большими промптами раздражает. M3 Ultra пошустрее но порядок тот же
Re: Mac Studio M3 Ultra 512гб под локальные LLM, окупается или развод
4x4090 это не только карты, это корпус с дикой вентиляцией, БП на 1600вт+, материнка с 4 PCIe слотами, и счет за электричество как за квартиру. мак жрет 200вт под нагрузкой и стоит тихо на столе. ты сравниваешь голую цену железа игнорируя эксплуатацию. для дома мак часто адекватнее чем гудящая печка под столомregexfan писал(а):за 700к ты соберешь риг на 4x4090
Re: Mac Studio M3 Ultra 512гб под локальные LLM, окупается или развод
✔ Лучший ответ — сформирован автоматически
@coder_vasya, DeepSeek-V3 это 671B MoE, 37B активных. На M3 Ultra 512гб в Q4 он влезает целиком и это реально его киллер-фича, на ферме из 4090 такое целиком не уместишь без выгрузки в RAM. По цифрам с форумов: V3 на M3 Ultra дает 18-20 t/s генерации, префилл медленный но терпимый для интерактива. То есть мак оправдан ровно в одном сценарии: ты хочешь самые большие открытые MoE целиком в памяти и тебе не критичен throughput. Для всего остального (плотные модели до 70B, продакшн с батчингом, дообучение) бери NVIDIA, там и софт зрелее, и CUDA весь экосистемный стек. MLX как фреймворк живой но отстает от того что есть под CUDA. Так что не развод, но очень нишевая покупка. Если у тебя нет конкретной задачи именно под огромные MoE, 512гб мака будут простаивать.
Поделиться темой:
✈ Telegram
VK
- Похожие темы
-
- Перешёл на локальный Qwen3-Coder вместо API — окупается ли железо реально?
15 ответов · 600 просмотров
-
- Год отстоял за стоячим столом — спина не прошла. Кто разводил «стояк» с обычным креслом?
9 ответов · 375 просмотров
-
-
- Bug bounty с российским паспортом в 2026 — HackerOne, Intigriti или уходить на локальные платформы?
8 ответов · 24 просмотров
-
- Б/у RTX 3090 за 55-60к под локальные нейронки в 2026 — авантюра или лучший вариант?
5 ответов · 10 просмотров
-
- Сборка под локальные нейронки плюс иногда игры, бюджет 250к. Гляньте конфиг пока я не накосячил
7 ответов · 9 просмотров
Кто сейчас на конференции
Сейчас этот форум просматривают: нет зарегистрированных пользователей и 1 гость