Ollama как настроить системный промпт и параметры генерации
Рейтинг: 62.1% · 15 голосов
Войдите, чтобы голосовать
Голосовать «За» и «Против» могут только авторизованные пользователи. Войдите в свой аккаунт — или зарегистрируйтесь, это займёт минуту.
Нет аккаунта? Зарегистрироваться
Ollama как настроить системный промпт и параметры генерации
Использую Ollama для локального ассистента, модель llama3.1:8b. Хочу задать постоянный системный промпт (чтобы не вводить каждый раз), поменять temperature и top_p, а ещё увеличить контекст до 8192. Читал про Modelfile, но не очень понял как это всё применить на практике.
✔ Лучший ответ выбран автором и совпадает с автоматическим подбором — omegadata7864
Полный пример рабочего Modelfile для кодинг-ассистента, которым сам пользуюсь: FROM llama3.1:8b — затем PARAMETER temperature 0.2 (низкая для кода — меньше галлюцинаций), PARAMETER num_ctx 16384, PARAMETER num_predict -1, PARAMETER repeat_penalty 1.05 — и SYSTEM с промптом типа «You are an expert software engineer. Provide working code with brief explanations. When unsure, say so explicitly.» Пос…
Re: Ollama как настроить системный промпт и параметры генерации
Modelfile — это именно то что тебе нужно. Создай файл с именем Modelfile (без расширения) в любой папке с таким содержимым: FROM llama3.1:8b / PARAMETER temperature 0.7 / PARAMETER top_p 0.9 / PARAMETER num_ctx 8192 / SYSTEM "Ты опытный ассистент-программист. Отвечай на русском языке, приводи примеры кода, будь лаконичен." — каждая директива на новой строке. Потом: ollama create my-assistant -f Modelfile и запускай через ollama run my-assistant.
- rootasync5175
- Сообщения: 3
- Зарегистрирован: Вт май 26, 2026 10:59 pm
Re: Ollama как настроить системный промпт и параметры генерации
Дополню: параметр num_ctx особенно важен — по умолчанию у Ollama всего 2048 токенов, что катастрофически мало для нормальной работы. Для llama3.1:8b можно смело ставить 8192, модель его поддерживает, и при 8GB VRAM должно хватить. Только помни что больший контекст = больше VRAM под KV-cache.
Re: Ollama как настроить системный промпт и параметры генерации
Ещё полезные параметры которые часто нужны: PARAMETER num_predict -1 (убирает лимит на длину ответа, по умолчанию обрезает на 128 токенов — многие не знают об этом и удивляются обрубленным ответам), PARAMETER repeat_penalty 1.1 (снижает повторения), PARAMETER top_k 40.
- omegadata7864
- Сообщения: 15
- Зарегистрирован: Ср май 13, 2026 5:39 am
Re: Ollama как настроить системный промпт и параметры генерации
✔ Лучший ответ — выбран автором и совпадает с авто-подбором
Полный пример рабочего Modelfile для кодинг-ассистента, которым сам пользуюсь: FROM llama3.1:8b — затем PARAMETER temperature 0.2 (низкая для кода — меньше галлюцинаций), PARAMETER num_ctx 16384, PARAMETER num_predict -1, PARAMETER repeat_penalty 1.05 — и SYSTEM с промптом типа «You are an expert software engineer. Provide working code with brief explanations. When unsure, say so explicitly.» После ollama create и запуска можешь проверить настройки командой ollama show my-assistant --modelfile — покажет итоговый Modelfile включая унаследованные параметры из базовой модели. Важно: если хочешь менять параметры на лету без пересоздания модели, в chat-режиме это не поддерживается, но через API можно передавать options в каждом запросе — POST на localhost:11434/api/chat с полем "options": {"temperature": 0.5}.
Поделиться темой:
✈ Telegram
VK
- Похожие темы
-
-
-
-
- vLLM в проде падает с OOM при всплесках трафика — как правильно настроить KV-cache и batching?
5 ответов · 11 просмотров
-
Кто сейчас на конференции
Сейчас этот форум просматривают: нет зарегистрированных пользователей и 1 гость