Ollama после обновления стала жрать в 2 раза больше RAM, у кого так же?

Теги: #Ollama#ram
Рейтинг: 0% · 0 голосов
Запуск больших языковых моделей локально: Llama, Mistral, Qwen, DeepSeek, Gemma. Квантизация GGUF, Ollama, llama.cpp, vLLM, LM Studio, выбор GPU и оптимизация инференса.
Ответить
Аватара пользователя
grigory2566
Сообщения: 15
Зарегистрирован: Пн май 11, 2026 6:02 pm

Ollama после обновления стала жрать в 2 раза больше RAM, у кого так же?

Сообщение grigory2566 »

Обновил Ollama до последней версии, и теперь та же llama3 8B отъедает почти 12 ГБ RAM вместо прежних 6. VRAM при этом грузится как обычно. Откатываться или это новая «фича»? Кто сталкивался?
👍 ❤️ 🔥 😄 🤔
Ответить
Поделиться темой: ✈ Telegram VK

Вернуться в «Локальные LLM и open-source модели»

Кто сейчас на конференции

Сейчас этот форум просматривают: нет зарегистрированных пользователей и 1 гость