Думаю отказаться от плюсовой подписки и крутить что-то локально. DeepSeek R1 в дистиллятах вроде хвалят. Кто реально пользуется в работе, а не для бенчмарков?
Полноценный R1 локально ты не запустишь без серверной фермы, это 671B. Реалистично — дистилляты на Qwen/Llama 7B-32B. 32B на 24GB врам идёт нормально через ollama, но до облачного оригинала ему далеко.
Гоняю 14B на 4060 Ti 16GB через ollama + open-webui. Для рутины (объяснить код, написать bash-скрипт) хватает за глаза, и данные не утекают наружу. Ради этого и переходил.
Честно, для сложных задач облако всё равно лучше. Я держу гибрид: локалка на чувствительный код и черновики, Claude/GPT на то, где реально нужны мозги. Платить 20 баксов перестал, беру по api — выходит дешевле раза в три.
Перешёл на локалку полгода назад из принципа, но вернулся к подписке. Возня с обновлениями моделей и квантами съедала больше времени, чем экономия денег. Кому дорого время — не советую.