Взял две MI50 32GB на авито по 19к, неделя боли с ROCm, рассказываю
Рейтинг: 43.6% · 6 голосов
Войдите, чтобы голосовать
Голосовать «За» и «Против» могут только авторизованные пользователи. Войдите в свой аккаунт — или зарегистрируйтесь, это займёт минуту.
Нет аккаунта? Зарегистрироваться
Взял две MI50 32GB на авито по 19к, неделя боли с ROCm, рассказываю
Короче, увидел на авито мужика из Екатеринбурга, продавал AMD Instinct MI50 32GB по 19к за штуку, остатки с какой-то фермы. 64 гига VRAM за 38к, не удержался.
Дальше неделя боли. ROCm 7 выпилил gfx906 совсем, на 6.3 половина либ сегфолтится. Поставил Ubuntu 22.04 и ROCm 5.7.3, завелось, но цифры грустные. А потом собрал llama.cpp с Vulkan бэкендом и внезапно вулкан оказался быстрее рокма процентов на 15. То есть весь этот рокмовый цирк был зря.
Цифры на двух картах: Qwen3.6 32B Q4_K_M около 14 ток/с, Llama 70B Q4 примерно 8. Промпт процессинг слабый, 150-180 ток/с, на промпте в 10к токенов сидишь минуту ждешь.
Отдельный квест охлаждение. Карты серверные, пассивные, без обдува за полминуты улетают к 95 градусам. Купил улитки на али по 800р, прикрутил хомутами, воет как советский пылесос. Жена уже спрашивала, что это за звук по ночам.
В целом оно живое и работает. Но если думаете повторить, закладывайте неделю жизни на грабли. Спрашивайте, пока все помню.
Дальше неделя боли. ROCm 7 выпилил gfx906 совсем, на 6.3 половина либ сегфолтится. Поставил Ubuntu 22.04 и ROCm 5.7.3, завелось, но цифры грустные. А потом собрал llama.cpp с Vulkan бэкендом и внезапно вулкан оказался быстрее рокма процентов на 15. То есть весь этот рокмовый цирк был зря.
Цифры на двух картах: Qwen3.6 32B Q4_K_M около 14 ток/с, Llama 70B Q4 примерно 8. Промпт процессинг слабый, 150-180 ток/с, на промпте в 10к токенов сидишь минуту ждешь.
Отдельный квест охлаждение. Карты серверные, пассивные, без обдува за полминуты улетают к 95 градусам. Купил улитки на али по 800р, прикрутил хомутами, воет как советский пылесос. Жена уже спрашивала, что это за звук по ночам.
В целом оно живое и работает. Но если думаете повторить, закладывайте неделю жизни на грабли. Спрашивайте, пока все помню.
✔ Лучший ответ сформирован автоматически — qemukun
b1llyn0m писал(а):собрал llama.cpp с Vulkan бэкендом и внезапно вулкан оказался быстрее рокма процентов на 15 подтверждаю, где-то с зимы вулкан в llama.cpp догнал и перегнал ROCm на старых амд. у меня RX 6800, снес рокм целиком и не жалею. и flash attention на вулкане уже работает, а раньше это был главный аргумент терпеть рокм. так что владельцам gfx906 можно вообще не страдать с версиями
Re: Взял две MI50 32GB на авито по 19к, неделя боли с ROCm, рассказываю
✔ Лучший ответ — сформирован автоматически
подтверждаю, где-то с зимы вулкан в llama.cpp догнал и перегнал ROCm на старых амд. у меня RX 6800, снес рокм целиком и не жалею. и flash attention на вулкане уже работает, а раньше это был главный аргумент терпеть рокм. так что владельцам gfx906 можно вообще не страдать с версиямиb1llyn0m писал(а):собрал llama.cpp с Vulkan бэкендом и внезапно вулкан оказался быстрее рокма процентов на 15
Re: Взял две MI50 32GB на авито по 19к, неделя боли с ROCm, рассказываю
8 ток/с на 70B это скорость чтения пенсионера. для чата с самим собой пойдет, для агентов и кода мусор, агент на каждый шаг будет минуту думать. плюс улитки воют, плюс 600 ватт из розетки. я бы доплатил до 3090, CUDA, exl3, vllm, все из коробки. дешевый VRAM это сыр в мышеловке
- enjoyer_borya
- Сообщения: 3
- Зарегистрирован: 15 май 2026, 02:57
Re: Взял две MI50 32GB на авито по 19к, неделя боли с ROCm, рассказываю
улитки напрямую в 12в это варварство. возьми ШИМ контроллер за 300р и подвяжи обороты к температуре, на генерации пусть орет, в простое тишина. и hotspot у MI50 смотри отдельно, не только edge. у карт после ферм прокладки высохшие, если разница edge и hotspot больше 25 градусов, пора разбирать и менять. я на своих менял, полет нормальный второй год
Re: Взял две MI50 32GB на авито по 19к, неделя боли с ROCm, рассказываю
доплатил это сколько конкретно? за 38к у тебя ноль штук 3090, за 76 одна, и это лотерея после майнинга без гарантии. а тут 64 гига HBM2 с пропускной около терабайта. для дома, где надо иногда погонять 70B и не продать почку, вариант абсолютно рабочий. не всем нужны агенты 24/7aqwzsx писал(а):я бы доплатил до 3090, CUDA, exl3, vllm, все из коробки
Re: Взял две MI50 32GB на авито по 19к, неделя боли с ROCm, рассказываю
@omnicrom, ollama официально только ROCm, а gfx906 они дропнули вслед за амд, так что мимо. либо старый докер образ, либо llama.cpp с вулканом, там сборка это буквально три команды с cmake. ну или koboldcpp, у него вулкан прямо в релизных бинарях лежит
Поделиться темой:
✈ Telegram
VK
- Похожие темы
-
- Pi 5 в рознице под 14 тысяч — переезжаем с Home Assistant на тонкий клиент с Авито?
5 ответов · 9 просмотров
-
-
- Купил 3080 с авито за 28к, через три недели артефакты. Рассказываю где лоханулся
7 ответов · 9 просмотров
-
-
-
Кто сейчас на конференции
Сейчас этот форум просматривают: нет зарегистрированных пользователей и 1 гость