Купил Mac Studio M3 Ultra 96гб под локальные модели и немного разочарован
Рейтинг: 43.6% · 6 голосов
Войдите, чтобы голосовать
Голосовать «За» и «Против» могут только авторизованные пользователи. Войдите в свой аккаунт — или зарегистрируйтесь, это займёт минуту.
Нет аккаунта? Зарегистрироваться
- juniorstack
- Сообщения: 62
- Зарегистрирован: 12 май 2026, 12:04
Купил Mac Studio M3 Ultra 96гб под локальные модели и немного разочарован
Взял Mac Studio M3 Ultra на 96гб памяти специально под локальные LLM, потому что начитался про единую память и что можно крупные модели запускать. По факту крупные веса грузятся да, 70B в Q4 влезает спокойно, но скорость генерации убивает весь кайф, 70B выдает около 8-9 токенов в секунду, читать можно но ждать долго. Делюсь чтобы не повторяли мою ошибку если гонитесь за скоростью.
✔ Лучший ответ сформирован автоматически — nginxlord
juniorstack писал(а):70B в Q4 влезает спокойно, но скорость генерации убивает весь кайфтак а зачем тебе 70B на локалке вообще. гоняй 32B в mlx формате, на твоем маке это будет 20+ t/s и качество вполне рабочее для большинства задач. мак не для того чтобы максимальную модель в него запихнуть, а чтобы среднюю гонять тихо и без отдельного компа с турбинами. ты просто юзкейс неправильно выбрал.
Re: Купил Mac Studio M3 Ultra 96гб под локальные модели и немного разочарован
@juniorstack, ну а ты что ждал, у мака пропускная способность памяти хорошая но вычислений мало против нвидии. он берет тем что в него 70-100B влезает там где у тебя на пеке только 3090 с 24гб. это не про скорость, это про размер.
Re: Купил Mac Studio M3 Ultra 96гб под локальные модели и немного разочарован
@juniorstack, 8 t/s на 70B это вообще нормально для м3 ультра, у людей и меньше бывает. ты на промпт процессинг посмотри, вот там настоящая боль, на длинном контексте секунд 20-30 только промпт жует прежде чем начать отвечать.
Re: Купил Mac Studio M3 Ultra 96гб под локальные модели и немного разочарован
✔ Лучший ответ — сформирован автоматически
так а зачем тебе 70B на локалке вообще. гоняй 32B в mlx формате, на твоем маке это будет 20+ t/s и качество вполне рабочее для большинства задач. мак не для того чтобы максимальную модель в него запихнуть, а чтобы среднюю гонять тихо и без отдельного компа с турбинами. ты просто юзкейс неправильно выбрал.juniorstack писал(а):70B в Q4 влезает спокойно, но скорость генерации убивает весь кайф
- archmaster
- Сообщения: 44
- Зарегистрирован: 15 май 2026, 01:57
Re: Купил Mac Studio M3 Ultra 96гб под локальные модели и немного разочарован
за эти деньги собрал бы пеку на 2x3090 б/у и имел бы и память и скорость. 48гб vram, 70B Q4 влезает, генерация 15+ t/s. шумит правда и греется, но за 380к можно еще и кондей в комнату поставить. мак конечно тихий и красивый, но как чисто инференс-машина оверпрайс.kfrosch писал(а):380к вышло с растаможкой
Поделиться темой:
✈ Telegram
VK
- Похожие темы
-
-
- Bug bounty с российским паспортом в 2026 — HackerOne, Intigriti или уходить на локальные платформы?
8 ответов · 24 просмотров
-
- Б/у RTX 3090 за 55-60к под локальные нейронки в 2026 — авантюра или лучший вариант?
5 ответов · 10 просмотров
-
- Galaxy S25 Edge — купил, разочарован экраном. Или это я чего-то не понимаю?
5 ответов · 9 просмотров
-
- Ryzen AI Max+ 395 со 128 ГБ приехал из Китая — замеры локальных LLM и немного боли
5 ответов · 9 просмотров
-
- Сборка под локальные нейронки плюс иногда игры, бюджет 250к. Гляньте конфиг пока я не накосячил
7 ответов · 9 просмотров
Кто сейчас на конференции
Сейчас этот форум просматривают: нет зарегистрированных пользователей и 2 гостя