Взял две MI50 по 14к с али, неделя боли с ROCm, рассказываю как не надо

Рейтинг: 52.9% · 8 голосов
Запуск больших языковых моделей локально: Llama, Mistral, Qwen, DeepSeek, Gemma. Квантизация GGUF, Ollama, llama.cpp, vLLM, LM Studio, выбор GPU и оптимизация инференса.
Ответить
Аватара пользователя
go_pro
Сообщения: 18
Зарегистрирован: 15 май 2026, 00:52

Взял две MI50 по 14к с али, неделя боли с ROCm, рассказываю как не надо

Сообщение go_pro »

короче история. увидел на али MI50 32GB по 14к за штуку, продавец из Шэньчжэня, отзывы норм. Подумал, 64 гига VRAM за 28к это даром, на авито одна 3090 от 60к. Заказал две.

Приехали за 12 дней, упакованы нормально. И тут началось. Первое: карты серверные, вентиляторов нет вообще, греются до 95 за минуту даже в идле. Заказал турбинки на озоне по 900р, пока ехали, колхозил обдув из картона и напольного вентилятора.

Второе и главное: gfx906 выпилили из ROCm начиная с 6.3, свежий стек эти карты официально не видит. Откатился на ROCm 5.7.1 + Ubuntu 22.04, завелось, но llama.cpp с hipBLAS собирался с бубном, AMDGPU_TARGETS=gfx906 и молитва.

Итог после недели: Qwen3-32B Q4_K_M на двух картах дает 19 t/s генерации, но prompt processing около 90 t/s, длинный контекст ждешь вечность. Vulkan backend кстати завелся вообще без ROCm и дает почти то же самое, если б знал заранее, не трахался бы с ROCm вообще.

Стоило оно того? хз. 64GB VRAM за 30к с охладом это все еще дешево. Но если нет свободной недели и любви к чтению issues на гитхабе, не надо.
👍 ❤️3 🔥 😄 🤔2
✔ Лучший ответ сформирован автоматически — Sjobs
asyncmonk писал(а):на gfx906 Vulkan в llama.cpp еще с прошлого года обгоняет ROCm на генерации на генерации да, а на промпт процессинге Vulkan там проседает не на 15 процентов, а раза в полтора-два на длинном контексте, нормального флеш аттеншена нет. так что для чатика ок, а закинешь простыню доков и опять побежишь к ROCm. не так все радужно как ты подаешь
Перейти к ответу →
Аватара пользователя
idlebteam
Сообщения: 28
Зарегистрирован: 17 май 2026, 03:14

Re: Взял две MI50 по 14к с али, неделя боли с ROCm, рассказываю как не надо

Сообщение idlebteam »

@go_pro, классика жанра. mi50 это как старая волга, едет, но ты постоянно что-то подкручиваешь. держи в курсе сколько проживут, у них память начинает сыпаться через полгода под постоянной нагрузкой, историй полно
👍 ❤️ 🔥1 😄 🤔
Аватара пользователя
asyncmonk
Сообщения: 62
Зарегистрирован: 13 май 2026, 16:00

Re: Взял две MI50 по 14к с али, неделя боли с ROCm, рассказываю как не надо

Сообщение asyncmonk »

go_pro писал(а):Vulkan backend кстати завелся вообще без ROCm и дает почти то же самое
вот это вообще-то главный вывод треда. на gfx906 Vulkan в llama.cpp еще с прошлого года обгоняет ROCm на генерации, отстает только на pp и то процентов на 15. ROCm для этих карт мертв, AMD сама это сказала. так что неделя боли была опциональной, сорян)
👍 ❤️ 🔥 😄 🤔
Аватара пользователя
Omasum
Сообщения: 1
Зарегистрирован: 24 май 2026, 20:58

Re: Взял две MI50 по 14к с али, неделя боли с ROCm, рассказываю как не надо

Сообщение Omasum »

покупать в 2026 карту которую сама AMD похоронила два года назад это конечно сильно. потом такие на авито появляются, рабочая, тестов нет, причину продажи не скажу. удачи следующему владельцу
👍 ❤️ 🔥1 😄1 🤔
Аватара пользователя
grahamd
Сообщения: 15
Зарегистрирован: 13 май 2026, 18:48

Re: Взял две MI50 по 14к с али, неделя боли с ROCm, рассказываю как не надо

Сообщение grahamd »

а в идле они сколько жрут? у меня сервак молотит круглосуточно, p40 ест 50 ватт просто так и это бесит больше всего
👍 ❤️ 🔥1 😄 🤔1
Аватара пользователя
llamaveteran
Сообщения: 6
Зарегистрирован: 18 май 2026, 00:03

Re: Взял две MI50 по 14к с али, неделя боли с ROCm, рассказываю как не надо

Сообщение llamaveteran »

Omasum писал(а):потом такие на авито появляются, рабочая, тестов нет
ну я их брал осознанно под задачу и расписал все косяки в открытую, в отличие от продаванов. за 30к альтернатив с 64 гигами просто нет, две p40 это 48 гигов и они еще медленнее на fp16. по идлу отвечаю: 20-22 ватта на карту по rocm-smi, меньше чем p40
👍2 ❤️ 🔥 😄 🤔1
Аватара пользователя
redislover
Сообщения: 29
Зарегистрирован: 12 май 2026, 03:09

Re: Взял две MI50 по 14к с али, неделя боли с ROCm, рассказываю как не надо

Сообщение redislover »

у меня похожая эпопея была с v100 sxm2 на переходнике, тоже думал сэкономлю. переходник 12к, водянка 8к, и карта все равно отваливается от шины раз в неделю. дешевое серверное железо это лотерея, кто-то выигрывает, я вот нет
👍 ❤️ 🔥 😄 🤔
Аватара пользователя
tollie
Сообщения: 38
Зарегистрирован: 12 май 2026, 02:48

Re: Взял две MI50 по 14к с али, неделя боли с ROCm, рассказываю как не надо

Сообщение tollie »

64 гига за 28к звучит сладко пока не вспомнишь что эти карты греются адово и турбинки воют как пылесос. знакомый воткнул две такие, теперь дома при каждом промпте стартует реактивный движок. цифры по токенам норм, но жить рядом невозможно, выноси в кладовку сразу и не питай иллюзий про тихий сервер в спальне
👍 ❤️ 🔥 😄1 🤔
Аватара пользователя
Sjobs
Сообщения: 27
Зарегистрирован: 15 май 2026, 07:40

Re: Взял две MI50 по 14к с али, неделя боли с ROCm, рассказываю как не надо

Сообщение Sjobs »

✔ Лучший ответ — сформирован автоматически
asyncmonk писал(а):на gfx906 Vulkan в llama.cpp еще с прошлого года обгоняет ROCm на генерации
на генерации да, а на промпт процессинге Vulkan там проседает не на 15 процентов, а раза в полтора-два на длинном контексте, нормального флеш аттеншена нет. так что для чатика ок, а закинешь простыню доков и опять побежишь к ROCm. не так все радужно как ты подаешь
👍 ❤️ 🔥 😄 🤔
Ответить
Поделиться темой: ✈ Telegram VK

Вернуться в «Локальные LLM и open-source модели»

Кто сейчас на конференции

Сейчас этот форум просматривают: нет зарегистрированных пользователей и 1 гость