Посчитал цену токена на своей 3090 против API и приуныл, переубедите

Рейтинг: 37.6% · 5 голосов
Запуск больших языковых моделей локально: Llama, Mistral, Qwen, DeepSeek, Gemma. Квантизация GGUF, Ollama, llama.cpp, vLLM, LM Studio, выбор GPU и оптимизация инференса.
Ответить
Аватара пользователя
rustdev
Сообщения: 7
Зарегистрирован: 25 май 2026, 05:37

Посчитал цену токена на своей 3090 против API и приуныл, переубедите

Сообщение rustdev »

Сел и честно посчитал, во сколько мне обходится локалка.

3090 брал год назад за 62к. Под нагрузкой система жрет 450 Вт, в простое около 80. Тариф 6.2 руб за кВтч, Москва. Кручу Qwen3.6 32B Q4, выдает около 28 ток/с.

За май нагенерил по логам примерно 4М токенов, кодинг и ревью в основном. Электричества вместе с простоем ушло рублей на 500. Но если размазать цену карты хотя бы на 3 года, выходит плюс 1700 в месяц. Итого 2200 руб за 4М токенов, то есть примерно 550 руб за миллион.

А теперь открываем прайс опенроутера: дипсик и квены по API стоят меньше доллара за миллион аутпута, со всеми накрутками на оплату выходит рублей 90-100. В пять-шесть раз дешевле моей локалки. И там 671B, а у меня 32B.

Получается, локалка это чисто хобби и налог на паранойю? Переубедите, а то за карту обидно.
👍3 ❤️1 🔥1 😄1 🤔
✔ Лучший ответ сформирован автоматически — hardredteam
roman2026 писал(а):любой из этих каналов завтра может отвалиться, уже проходили и не просто отвалиться, они еще и тихо деградируют. провайдеры спокойно подсовывают квантованную версию в час пик, на опенроутере половина дешевых эндпоинтов это fp8 или вообще непонятно что, и ты ничего не докажешь. локальная модель под тобой ночью не меняется. когда на ней пайплайн, это важнее цены
Перейти к ответу →
Аватара пользователя
fpga2025
Сообщения: 7
Зарегистрирован: 19 май 2026, 08:28

Re: Посчитал цену токена на своей 3090 против API и приуныл, переубедите

Сообщение fpga2025 »

у меня рабочий код под NDA, в API я его залить не могу физически, безопасники съедят. так что математика простая: либо локалка, либо никак. твои 550 руб за миллион это цена возможности вообще пользоваться LLM на работе, и она копеечная
👍 ❤️ 🔥 😄 🤔
Аватара пользователя
Sjobs
Сообщения: 27
Зарегистрирован: 15 май 2026, 07:40

Re: Посчитал цену токена на своей 3090 против API и приуныл, переубедите

Сообщение Sjobs »

rustdev писал(а):если размазать цену карты хотя бы на 3 года, выходит плюс 1700 в месяц
вот тут ошибка. карта не сгорает в ноль за 3 года, 3090 и сейчас уходит за 55-60, ликвидное железо. реальная амортизация это цена покупки минус цена продажи, и вот эту разницу дели на срок. пересчитай, твой разрыв с API съежится раза в три
👍 ❤️ 🔥 😄 🤔
Аватара пользователя
roman2026
Сообщения: 39
Зарегистрирован: 10 май 2026, 23:40

Re: Посчитал цену токена на своей 3090 против API и приуныл, переубедите

Сообщение roman2026 »

@fpga2025, насчет твоих 90-100 рублей за миллион. а платить ты как собрался? напрямую российской картой никуда, прослойки берут 15-25 процентов и дохнут раз в полгода, крипта это отдельный квест с обменниками. и любой из этих каналов завтра может отвалиться, уже проходили. локалка работает без банков и без настроения дяди за океаном
👍 ❤️1 🔥 😄 🤔1
Аватара пользователя
davidwor
Сообщения: 37
Зарегистрирован: 12 май 2026, 01:52

Re: Посчитал цену токена на своей 3090 против API и приуныл, переубедите

Сообщение davidwor »

опять таблички про окупаемость, лол. хобби не окупается, кто бы мог подумать. удочка тоже дороже рыбы из магазина, но рыбаки почему-то не плачут на форумах
👍 ❤️1 🔥1 😄1 🤔1
Аватара пользователя
hardredteam
Сообщения: 7
Зарегистрирован: 10 май 2026, 23:33

Re: Посчитал цену токена на своей 3090 против API и приуныл, переубедите

Сообщение hardredteam »

✔ Лучший ответ — сформирован автоматически
roman2026 писал(а):любой из этих каналов завтра может отвалиться, уже проходили
и не просто отвалиться, они еще и тихо деградируют. провайдеры спокойно подсовывают квантованную версию в час пик, на опенроутере половина дешевых эндпоинтов это fp8 или вообще непонятно что, и ты ничего не докажешь. локальная модель под тобой ночью не меняется. когда на ней пайплайн, это важнее цены
👍1 ❤️1 🔥 😄1 🤔
Аватара пользователя
Rhemix
Сообщения: 71
Зарегистрирован: 12 май 2026, 03:33

Re: Посчитал цену токена на своей 3090 против API и приуныл, переубедите

Сообщение Rhemix »

истина посередине, как обычно. я рутину гоняю через дешевый api, а все что нельзя наружу, на своей карте. и момент, который тут все упускают: нынешние цены api это демпинг на инвесторские деньги, дипсик за доллар это не себестоимость, это захват рынка. кончатся деньги, ценник поедет вверх. а 3090 у тебя в руках останется. я бы не спешил с выводами по одной табличке за май
👍1 ❤️ 🔥1 😄 🤔
Ответить
Поделиться темой: ✈ Telegram VK

Вернуться в «Локальные LLM и open-source модели»

Кто сейчас на конференции

Сейчас этот форум просматривают: нет зарегистрированных пользователей и 2 гостя