Arc B580 за 34к под локалки, кто живой гонял? Vulkan в llama.cpp уже не дно или как
Рейтинг: 30.1% · 4 голосов
Войдите, чтобы голосовать
Голосовать «За» и «Против» могут только авторизованные пользователи. Войдите в свой аккаунт — или зарегистрируйтесь, это займёт минуту.
Нет аккаунта? Зарегистрироваться
Arc B580 за 34к под локалки, кто живой гонял? Vulkan в llama.cpp уже не дно или как
Собираю недорогую машинку под инференс, бюджет на карту тысяч 35. Варианты: б/у 3070 8GB с авито за 27к или новая B580 12GB, в днс за 34к лежит. По памяти арк выигрывает очевидно, 12 против 8, но как там с софтом? Читал, что вулкан бэкенд в llama.cpp за последний год сильно подтянули и на арках он почти догнал sycl. Но одно дело читал, другое у живого владельца спросить.
Кто гоняет B580, киньте циферки на чем-нибудь типа Qwen3 14B в Q4_K_M, сколько t/s генерация и сколько pp. И насколько больно с драйверами на линуксе.
Кто гоняет B580, киньте циферки на чем-нибудь типа Qwen3 14B в Q4_K_M, сколько t/s генерация и сколько pp. И насколько больно с драйверами на линуксе.
✔ Лучший ответ сформирован автоматически — tor91
debian91 писал(а):добавь 20ку и возьми 3090 с авито за 55 добавь 20ку это уже бюджет 55 вместо 35, так можно и до H100 досоветоваться. плюс к 3090 нужен бп ватт на 750, в бюджетной сборке его нет, еще 6-7к сверху. и это карта 2020 года после неизвестно чего, у меня одна такая с авито через четыре месяца начала артефачить, продавец испарился. B580 новая с гарантией, жрет 190 ватт и встает в любой …
Re: Arc B580 за 34к под локалки, кто живой гонял? Vulkan в llama.cpp уже не дно или как
@agama1, Есть B580, гоняю с осени. Ubuntu 24.04, llama.cpp под Vulkan, собирается без бубна. Qwen3 14B Q4_K_M: генерация 31-33 t/s, pp около 550. Под SYCL pp повыше, под 800, но ради этого ставить oneAPI и пересобирать, ну его, я плюнул. 12 гигов хватает на 14B Q4 с контекстом 16к впритык.
Драйвера на линуксе норм, ядро 6.11+ и все из коробки. На винде тоже работает, но цифры были процентов на 10 ниже.
Драйвера на линуксе норм, ядро 6.11+ и все из коробки. На винде тоже работает, но цифры были процентов на 10 ниже.
Re: Arc B580 за 34к под локалки, кто живой гонял? Vulkan в llama.cpp уже не дно или как
зачем эти эксперименты. добавь 20ку и возьми 3090 с авито за 55, cuda решает, весь тулинг писан под нвидию. а с арком будешь каждый второй релиз ловить, что у тебя опять что-то не собралось. проходили уже с амд
Re: Arc B580 за 34к под локалки, кто живой гонял? Vulkan в llama.cpp уже не дно или как
✔ Лучший ответ — сформирован автоматически
добавь 20ку это уже бюджет 55 вместо 35, так можно и до H100 досоветоваться. плюс к 3090 нужен бп ватт на 750, в бюджетной сборке его нет, еще 6-7к сверху. и это карта 2020 года после неизвестно чего, у меня одна такая с авито через четыре месяца начала артефачить, продавец испарился. B580 новая с гарантией, жрет 190 ватт и встает в любой системникdebian91 писал(а):добавь 20ку и возьми 3090 с авито за 55
- golanglover
- Сообщения: 14
- Зарегистрирован: 26 май 2026, 21:49
Re: Arc B580 за 34к под локалки, кто живой гонял? Vulkan в llama.cpp уже не дно или как
@debian91, с арками есть мелочь которая бесит: без ASPM в биосе карта в простое жрет 35-40 ватт вместо 5-7. если машинка будет молотить 24/7 как домашний сервер, за год набегает заметно. лечится включением ASPM, но на части материнок после этого глючит сон. проверь сразу как приедет
Re: Arc B580 за 34к под локалки, кто живой гонял? Vulkan в llama.cpp уже не дно или как
+1, sycl того не стоит. а вот оллама на арке так нормально и не живет, форк на ipex-llm вечно отстает от апстрима на пару месяцев. так что только чистый llama.cpp, имей в виду, если привык к олламеlentyaj писал(а):Под SYCL pp повыше, под 800, но ради этого ставить oneAPI и пересобирать, ну его
Поделиться темой:
✈ Telegram
VK
- Похожие темы
-
- Погонял Sora 2 неделю — это всё ещё генератор красивых слайдшоу или уже рабочий инструмент?
23 ответов · 1080 просмотров
-
- Кто реально гонял Python 3.13t free-threaded? У меня одиночный поток просел на 40%
7 ответов · 633 просмотров
-
- 150к на сетап под локалки: б/у 3090 с авито, две 5060 Ti или добивать на мак
7 ответов · 8 просмотров
-
-
- JetBrains положил Junie во все подписки All Products. Кто уже гонял против Claude Code?
4 ответов · 6 просмотров
-
Кто сейчас на конференции
Сейчас этот форум просматривают: нет зарегистрированных пользователей и 1 гость