Посчитал почем выходит локалка против API и чет приуныл
Рейтинг: 30.1% · 4 голосов
Войдите, чтобы голосовать
Голосовать «За» и «Против» могут только авторизованные пользователи. Войдите в свой аккаунт — или зарегистрируйтесь, это займёт минуту.
Нет аккаунта? Зарегистрироваться
- seniorwarlock
- Сообщения: 57
- Зарегистрирован: 12 май 2026, 00:23
Посчитал почем выходит локалка против API и чет приуныл
сел вчера с калькулятором. сервер: 2x3090 с авито по 62к = 124к, эпик 7302 + мать + 128 ддр4 еще 70к, бп на 1200вт 15к. итого 210к разово. под нагрузкой жрет 800вт, у меня 6.5р за квтч, при 8 часах в день это примерно 1250р в месяц только на свет.
теперь api. дипсик стоит копейки, меньше 100р за миллион токенов на выходе по текущему курсу. мой реальный расход за май через openrouter: 480 рублей. ЧЕТЫРЕСТА ВОСЕМЬДЕСЯТ. это окупаемость железа 35+ лет, карты столько не живут.
и про качество: локально я гоняю максимум 32B в Q4, по api мне доступен фуллсайз дипсик и квен 235 в fp8. то есть плачу сильно больше за модель которая сильно тупее.
объясните еще раз, зачем мы это делаем?
теперь api. дипсик стоит копейки, меньше 100р за миллион токенов на выходе по текущему курсу. мой реальный расход за май через openrouter: 480 рублей. ЧЕТЫРЕСТА ВОСЕМЬДЕСЯТ. это окупаемость железа 35+ лет, карты столько не живут.
и про качество: локально я гоняю максимум 32B в Q4, по api мне доступен фуллсайз дипсик и квен 235 в fp8. то есть плачу сильно больше за модель которая сильно тупее.
объясните еще раз, зачем мы это делаем?
✔ Лучший ответ сформирован автоматически — solidity_nerd
seniorwarlock писал(а):это окупаемость железа 35+ лет, карты столько не живут математика с дырой. ты считаешь окупаемость по своему расходу в 480р, а считать надо по тому что ты БУДЕШЬ жечь, когда токены станут бесплатными. у меня агенты наматывают 40-50М токенов в день на батч-задачи, разбор логов, классификация тикетов. по api это было бы тысяч 15-20 в месяц. локалка отбилась за год. а кто гоня…
- solidity_nerd
- Сообщения: 5
- Зарегистрирован: 11 май 2026, 10:06
Re: Посчитал почем выходит локалка против API и чет приуныл
✔ Лучший ответ — сформирован автоматически
математика с дырой. ты считаешь окупаемость по своему расходу в 480р, а считать надо по тому что ты БУДЕШЬ жечь, когда токены станут бесплатными. у меня агенты наматывают 40-50М токенов в день на батч-задачи, разбор логов, классификация тикетов. по api это было бы тысяч 15-20 в месяц. локалка отбилась за год. а кто гоняет чатик два раза в день, тому да, api и не паритьсяseniorwarlock писал(а):это окупаемость железа 35+ лет, карты столько не живут
- seniorwarlock
- Сообщения: 57
- Зарегистрирован: 12 май 2026, 00:23
Re: Посчитал почем выходит локалка против API и чет приуныл
@solidity_nerd, лол, вы оба считаете будто железо и свет это все расходы. время. я на свою сборку убил недели две чистого времени, обновления, кванты, конфиги, поломанные темплейты. посчитайте свою ставку за час и заплачьте
Re: Посчитал почем выходит локалка против API и чет приуныл
ну так есть яндекс клауд и сбер, инференс опенсорсных весов в рф юрисдикции, 152-фз, договор, все дела. дороже дипсика раза в три, но nda не нарушаешь. локалка не единственный выход для параноиков, просто самый трушныйgrahamd писал(а):отправлять его в api китайской контры это статья договора
Re: Посчитал почем выходит локалка против API и чет приуныл
а никто не вспомнил, что api модели тихо лоботомируют. квантуют на сервинге, роутят на дистилляты в часы пик, ты никогда не знаешь что именно тебе ответило. локально у меня детерминированный квант, одинаковый вчера и завтра. для прода с регрессионными тестами это важнее цены
Re: Посчитал почем выходит локалка против API и чет приуныл
это городская легенда наполовину. у опенроутера да, провайдеры разные и там зоопарк квантов, это прямо в карточке провайдера написано. но первоисточник, api самого дипсика или квена, гоняет то что заявлено. пруфов деградации первоисточников никто ни разу не принес, одни вайбыchase2 писал(а):квантуют на сервинге, роутят на дистилляты в часы пик
Поделиться темой:
✈ Telegram
VK
- Похожие темы
-
-
- Serverless — это всё ещё хайп или реально дешевле? Посчитал Lambda vs обычный контейнер
8 ответов · 363 просмотров
-
- LoRA для Flux — почему тренировка выходит мыльной, хотя датасет нормальный?
9 ответов · 22 просмотров
-
- Вернулся в Москву после 3 лет в Белграде, посчитал деньги и не понимаю зачем уезжал
6 ответов · 17 просмотров
-
-
Кто сейчас на конференции
Сейчас этот форум просматривают: нет зарегистрированных пользователей и 2 гостя