Взял две Tesla P40 с авито под 70B, лучше бы не брал

rust_ninja · Сообщение **rust_ninja** » 31 май 2026, 11:37

Короче история. В апреле увидел на авито две P40 по 18500 у барыги из Новосиба, продавал партией после разбора серверов. Подумал, 48 гигов врама за 37к, халява же, 70B влезет в Q4. Взял.

Что по факту. Карты серверные, своего охлаждения нет, купил турбинки на озоне по 1400, шум как у пылесоса. Дальше выяснилось что паскаль это 2016 год и fp16 там кастрированный, считается фактически через fp32. Llama-3.3-70B Q4_K_M запустилась, выдает 4.2 t/s генерации. Но это полбеды. Обработка промпта 60-80 t/s, то есть закинул файл на 8к токенов и ждешь две минуты до первого слова.

Пробовал -sm row, стало 5.1 t/s, ну такое. vLLM на паскале уже официально не собирается. В итоге риг гудит, жрет 500 ватт из розетки и проигрывает по удобству бесплатному лимиту на опенроутере. Не повторяйте моих ошибок.

mstrbates · Сообщение **mstrbates** » 31 май 2026, 16:32

ну а что ты хотел от железки 2016 года за 18к. это все проходили еще в 2024, p40 брали когда 3090 стоила 90+, сейчас смысла ноль

nixos69 · Сообщение **nixos69** » 31 май 2026, 19:17

@rust_ninja, не соглашусь что ноль. у меня пара p40 третий год пашет, но я на них держу qwen 14b и эмбеддинги для rag, для такого они норм. 70b на паскалях это ты сам себе злой буратино, тут вопросов нет. и кстати flash attention в llama.cpp на p40 работает, -fa включал? у меня промпт процессинг с ним процентов на 30 бодрее

FpgaDev · Сообщение **FpgaDev** » 31 май 2026, 19:39

@rust_ninja, повезло еще что рабочие пришли. мне в том году под видом p40 приехала m40 с перебитой наклейкой. авито деньги вернул, но только после месяца переписки с поддержкой

sepiatone · Сообщение **sepiatone** » 31 май 2026, 23:01

продавай пока на них спрос есть, студенты под эмбеддинги до сих пор берут. одна 3090 с авито за 58-62к закроет 90 процентов твоих хотелок. да и 70b в 2026 уже не особо нужен, нынешние 30-32b их догнали

seniorsamurai

а бп какой? у p40 пики до 250 ватт на карту, плюс ксеон. если там чифтек на 650 то проблемы у тебя не только в картах

rawgoblin · Сообщение **rawgoblin** » 01 июн 2026, 02:00

+1 к продавай. сам наступил на эти грабли в январе, скинул через месяц с минусом в 4к и считаю что дешево отделался

Взял две Tesla P40 с авито под 70B, лучше бы не брал

Взял две Tesla P40 с авито под 70B, лучше бы не брал

Re: Взял две Tesla P40 с авито под 70B, лучше бы не брал

Re: Взял две Tesla P40 с авито под 70B, лучше бы не брал

Re: Взял две Tesla P40 с авито под 70B, лучше бы не брал

Re: Взял две Tesla P40 с авито под 70B, лучше бы не брал

Re: Взял две Tesla P40 с авито под 70B, лучше бы не брал

Re: Взял две Tesla P40 с авито под 70B, лучше бы не брал

Кто сейчас на конференции