Посчитал стоимость домашнего инференса за месяц и расстроился, API дешевле в разы

Рейтинг: 37.6% · 5 голосов
Запуск больших языковых моделей локально: Llama, Mistral, Qwen, DeepSeek, Gemma. Квантизация GGUF, Ollama, llama.cpp, vLLM, LM Studio, выбор GPU и оптимизация инференса.
Ответить
Аватара пользователя
hunter22
Сообщения: 50
Зарегистрирован: 11 май 2026, 00:25

Посчитал стоимость домашнего инференса за месяц и расстроился, API дешевле в разы

Сообщение hunter22 »

Сел с калькулятором и лучше бы не садился.

Риг: 2x3090, эпик б/у, 128 ддр4. Под нагрузкой жрет около 800 ватт, в простое 110, карты держат vram. Кручу модели часа 4 в день плюс простой 24/7, вышло порядка 130 кВтч в месяц. По московскому тарифу почти 7 рублей это под 900р. Карты брал по 58к год назад, продам через год тысяч по 45 если повезет, амортизация еще ~2200 в месяц. Итого реальная цена владения около 3 тысяч в месяц, без учета времени на возню.

Мой объем это примерно 8-10 млн токенов в месяц. Через api на дипсике или квене это рублей 300-500. В семь, в десять раз дешевле.

И вот я сижу и думаю, за что я плачу разницу. За то что мои промпты не видит дядя? Так я опенсорсный код пишу. Переубедите, а то реально продам все к черту.
👍1 ❤️1 🔥1 😄2 🤔
✔ Лучший ответ сформирован автоматически — kotlin123
hunter22 писал(а):Мой объем это примерно 8-10 млн токенов в месяц Вот и вся разгадка, нагрузка у тебя детская. Подключи агентов на полный день, у меня кодинг-агенты жгут 60-80 млн токенов в месяц, по api это уже 8-15к рублей в зависимости от модели, и цифра только растет. Локалка при таких объемах отбивается за полгода-год. У тебя кейс под api, у меня под железо, универсального ответа тут нет.
Перейти к ответу →
Аватара пользователя
svelte88
Сообщения: 63
Зарегистрирован: 12 май 2026, 11:49

Re: Посчитал стоимость домашнего инференса за месяц и расстроился, API дешевле в разы

Сообщение svelte88 »

продал риг в январе, перешел на api, ни одного дня не жалел
👍3 ❤️1 🔥 😄 🤔
Аватара пользователя
valru
Сообщения: 63
Зарегистрирован: 11 май 2026, 05:24

Re: Посчитал стоимость домашнего инференса за месяц и расстроился, API дешевле в разы

Сообщение valru »

Ты считаешь токены, а у некоторых другая бухгалтерия. Я работаю с банковским заказчиком, в договоре прямым текстом запрет на передачу кода третьим лицам, любые облачные llm под запретом, зарубежные api тем более. Либо локалка, либо вообще без llm. 3 тысячи в месяц против потери контракта, смешная математика.
👍1 ❤️ 🔥1 😄1 🤔1
Аватара пользователя
kotlin123
Сообщения: 46
Зарегистрирован: 12 май 2026, 14:33

Re: Посчитал стоимость домашнего инференса за месяц и расстроился, API дешевле в разы

Сообщение kotlin123 »

✔ Лучший ответ — сформирован автоматически
hunter22 писал(а):Мой объем это примерно 8-10 млн токенов в месяц
Вот и вся разгадка, нагрузка у тебя детская. Подключи агентов на полный день, у меня кодинг-агенты жгут 60-80 млн токенов в месяц, по api это уже 8-15к рублей в зависимости от модели, и цифра только растет. Локалка при таких объемах отбивается за полгода-год. У тебя кейс под api, у меня под железо, универсального ответа тут нет.
👍 ❤️1 🔥2 😄 🤔1
Аватара пользователя
juniorphoenix
Сообщения: 21
Зарегистрирован: 14 май 2026, 18:58

Re: Посчитал стоимость домашнего инференса за месяц и расстроился, API дешевле в разы

Сообщение juniorphoenix »

зимой это не расходы а обогрев, у меня 3090 кабинет греет вместо батареи лол. и кстати в иркутске тариф полтора рубля, при таком раскладе вся твоя математика переворачивается. так что ответ как всегда: зависит от региона хах
👍3 ❤️ 🔥 😄1 🤔
Аватара пользователя
Farkle
Сообщения: 37
Зарегистрирован: 12 май 2026, 00:45

Re: Посчитал стоимость домашнего инференса за месяц и расстроился, API дешевле в разы

Сообщение Farkle »

@valru, Душный момент, но амортизацию ты посчитал с потолка. 3090 на вторичке за два года почти не подешевела, в 24-м брали по 60, сейчас на авито 55-58, потому что 24 гига дешевле никто не дает до сих пор. Реальная амортизация у тебя рублей 300 в месяц, а не 2200. Пересчитай, разрыв сразу не семикратный станет. Хотя по чистой экономике да, api выигрывает.
👍 ❤️ 🔥2 😄 🤔
Аватара пользователя
asyncmonk
Сообщения: 62
Зарегистрирован: 13 май 2026, 16:00

Re: Посчитал стоимость домашнего инференса за месяц и расстроился, API дешевле в разы

Сообщение asyncmonk »

valru писал(а):Либо локалка, либо вообще без llm
поддержу с оговоркой. видел контору где так же говорили, а потом выяснилось что половина разрабов тихонько кидала куски кода в бесплатный чатжпт с личных ноутов. локалка в контуре это не только комплаенс, это единственный способ чтобы люди реально перестали таскать код наружу. дай им быстрый внутренний эндпоинт и проблема уходит сама
👍 ❤️ 🔥 😄 🤔
Аватара пользователя
mgyorko
Сообщения: 7
Зарегистрирован: 12 май 2026, 19:04

Re: Посчитал стоимость домашнего инференса за месяц и расстроился, API дешевле в разы

Сообщение mgyorko »

ТС, а хобби обязано окупаться? спроси у рыбаков почем у них выходит килограмм рыбы с учетом лодки, снастей и бензина. кому-то нравится крутить кванты и смотреть на t/s, это нормально. не нравится, продавай, 3090 уйдет за день
👍2 ❤️ 🔥 😄 🤔
Ответить
Поделиться темой: ✈ Telegram VK

Вернуться в «Локальные LLM и open-source модели»

Кто сейчас на конференции

Сейчас этот форум просматривают: нет зарегистрированных пользователей и 2 гостя