Посчитал стоимость домашнего инференса за месяц и расстроился, API дешевле в разы
Рейтинг: 37.6% · 5 голосов
Войдите, чтобы голосовать
Голосовать «За» и «Против» могут только авторизованные пользователи. Войдите в свой аккаунт — или зарегистрируйтесь, это займёт минуту.
Нет аккаунта? Зарегистрироваться
Посчитал стоимость домашнего инференса за месяц и расстроился, API дешевле в разы
Сел с калькулятором и лучше бы не садился.
Риг: 2x3090, эпик б/у, 128 ддр4. Под нагрузкой жрет около 800 ватт, в простое 110, карты держат vram. Кручу модели часа 4 в день плюс простой 24/7, вышло порядка 130 кВтч в месяц. По московскому тарифу почти 7 рублей это под 900р. Карты брал по 58к год назад, продам через год тысяч по 45 если повезет, амортизация еще ~2200 в месяц. Итого реальная цена владения около 3 тысяч в месяц, без учета времени на возню.
Мой объем это примерно 8-10 млн токенов в месяц. Через api на дипсике или квене это рублей 300-500. В семь, в десять раз дешевле.
И вот я сижу и думаю, за что я плачу разницу. За то что мои промпты не видит дядя? Так я опенсорсный код пишу. Переубедите, а то реально продам все к черту.
Риг: 2x3090, эпик б/у, 128 ддр4. Под нагрузкой жрет около 800 ватт, в простое 110, карты держат vram. Кручу модели часа 4 в день плюс простой 24/7, вышло порядка 130 кВтч в месяц. По московскому тарифу почти 7 рублей это под 900р. Карты брал по 58к год назад, продам через год тысяч по 45 если повезет, амортизация еще ~2200 в месяц. Итого реальная цена владения около 3 тысяч в месяц, без учета времени на возню.
Мой объем это примерно 8-10 млн токенов в месяц. Через api на дипсике или квене это рублей 300-500. В семь, в десять раз дешевле.
И вот я сижу и думаю, за что я плачу разницу. За то что мои промпты не видит дядя? Так я опенсорсный код пишу. Переубедите, а то реально продам все к черту.
✔ Лучший ответ сформирован автоматически — kotlin123
hunter22 писал(а):Мой объем это примерно 8-10 млн токенов в месяц Вот и вся разгадка, нагрузка у тебя детская. Подключи агентов на полный день, у меня кодинг-агенты жгут 60-80 млн токенов в месяц, по api это уже 8-15к рублей в зависимости от модели, и цифра только растет. Локалка при таких объемах отбивается за полгода-год. У тебя кейс под api, у меня под железо, универсального ответа тут нет.
Re: Посчитал стоимость домашнего инференса за месяц и расстроился, API дешевле в разы
Ты считаешь токены, а у некоторых другая бухгалтерия. Я работаю с банковским заказчиком, в договоре прямым текстом запрет на передачу кода третьим лицам, любые облачные llm под запретом, зарубежные api тем более. Либо локалка, либо вообще без llm. 3 тысячи в месяц против потери контракта, смешная математика.
Re: Посчитал стоимость домашнего инференса за месяц и расстроился, API дешевле в разы
✔ Лучший ответ — сформирован автоматически
Вот и вся разгадка, нагрузка у тебя детская. Подключи агентов на полный день, у меня кодинг-агенты жгут 60-80 млн токенов в месяц, по api это уже 8-15к рублей в зависимости от модели, и цифра только растет. Локалка при таких объемах отбивается за полгода-год. У тебя кейс под api, у меня под железо, универсального ответа тут нет.hunter22 писал(а):Мой объем это примерно 8-10 млн токенов в месяц
- juniorphoenix
- Сообщения: 21
- Зарегистрирован: 14 май 2026, 18:58
Re: Посчитал стоимость домашнего инференса за месяц и расстроился, API дешевле в разы
зимой это не расходы а обогрев, у меня 3090 кабинет греет вместо батареи лол. и кстати в иркутске тариф полтора рубля, при таком раскладе вся твоя математика переворачивается. так что ответ как всегда: зависит от региона хах
Re: Посчитал стоимость домашнего инференса за месяц и расстроился, API дешевле в разы
@valru, Душный момент, но амортизацию ты посчитал с потолка. 3090 на вторичке за два года почти не подешевела, в 24-м брали по 60, сейчас на авито 55-58, потому что 24 гига дешевле никто не дает до сих пор. Реальная амортизация у тебя рублей 300 в месяц, а не 2200. Пересчитай, разрыв сразу не семикратный станет. Хотя по чистой экономике да, api выигрывает.
Re: Посчитал стоимость домашнего инференса за месяц и расстроился, API дешевле в разы
поддержу с оговоркой. видел контору где так же говорили, а потом выяснилось что половина разрабов тихонько кидала куски кода в бесплатный чатжпт с личных ноутов. локалка в контуре это не только комплаенс, это единственный способ чтобы люди реально перестали таскать код наружу. дай им быстрый внутренний эндпоинт и проблема уходит самаvalru писал(а):Либо локалка, либо вообще без llm
Re: Посчитал стоимость домашнего инференса за месяц и расстроился, API дешевле в разы
ТС, а хобби обязано окупаться? спроси у рыбаков почем у них выходит килограмм рыбы с учетом лодки, снастей и бензина. кому-то нравится крутить кванты и смотреть на t/s, это нормально. не нравится, продавай, 3090 уйдет за день
Поделиться темой:
✈ Telegram
VK
- Похожие темы
-
- Raspberry Pi 5 или мини-ПК для домашнего сервера в 2026? Уже сомневаюсь
10 ответов · 2908 просмотров
-
-
- Воздух против AIO в 2026: есть ли вообще смысл в водянке для домашнего ПК?
11 ответов · 492 просмотров
-
- Traefik vs Caddy vs Nginx Proxy Manager — что выбрать в 2026 для домашнего сервера?
8 ответов · 332 просмотров
-
- vLLM для домашнего сервера — есть ли смысл или это только для дата-центров?
6 ответов · 25 просмотров
-
Кто сейчас на конференции
Сейчас этот форум просматривают: нет зарегистрированных пользователей и 2 гостя