Неделю дебажил 'тупую' модель, а это Ollama резала контекст до 2048
Рейтинг: 32.6% · 14 голосов
Войдите, чтобы голосовать
Голосовать «За» и «Против» могут только авторизованные пользователи. Войдите в свой аккаунт — или зарегистрируйтесь, это займёт минуту.
Нет аккаунта? Зарегистрироваться
✔ Лучший ответ сформирован автоматически — filipp_proxy20
Это боль любого кто начинает с Ollama. Дефолт 2048 — это наследие эпохи когда 4096 контекст считался огромным. Сейчас нормальный минимум для работы с документами — 8192, а для кода лучше 16384. Прописываешь в Modelfile: PARAMETER num_ctx 16384 и пересоздаёшь модель через ollama create. Или через API параметром options.num_ctx прямо в запросе если не хочешь трогать Modelfile.
- pycloud484
- Сообщения: 4
- Зарегистрирован: Пн май 11, 2026 1:24 am
- oleg_linux
- Сообщения: 9
- Зарегистрирован: Вт май 12, 2026 12:32 am
- milana_kernel
- Сообщения: 1
- Зарегистрирован: Чт май 14, 2026 10:10 pm
- boris_null45
- Сообщения: 13
- Зарегистрирован: Пн май 11, 2026 1:28 pm
- filipp_proxy20
- Сообщения: 11
- Зарегистрирован: Вс май 10, 2026 10:39 pm
Re: Неделю дебажил 'тупую' модель, а это Ollama резала контекст до 2048
✔ Лучший ответ — сформирован автоматически
Это боль любого кто начинает с Ollama. Дефолт 2048 — это наследие эпохи когда 4096 контекст считался огромным. Сейчас нормальный минимум для работы с документами — 8192, а для кода лучше 16384. Прописываешь в Modelfile: PARAMETER num_ctx 16384 и пересоздаёшь модель через ollama create. Или через API параметром options.num_ctx прямо в запросе если не хочешь трогать Modelfile.
- pynode5808
- Сообщения: 31
- Зарегистрирован: Пн май 11, 2026 4:55 pm
Re: Неделю дебажил 'тупую' модель, а это Ollama резала контекст до 2048
Хочу предостеречь от другой крайности — ставить num_ctx в 32768 и выше по принципу «чем больше тем лучше». VRAM жрёт квадратично: у меня на 3070 8GB с Llama 3.1 8B при контексте 8k спокойно, при 32k уже OOM. Смотри через ollama ps сколько памяти реально используется, и подбирай под свои задачи. Для большинства документов 8192 достаточно.
Поделиться темой:
✈ Telegram
VK
- Похожие темы
-
-
-
- Погонял Sora 2 неделю — это всё ещё генератор красивых слайдшоу или уже рабочий инструмент?
19 ответов · 1066 просмотров
-
-
-
- Контекст-окно растёт, а агент всё равно тупеет на больших задачах. Боремся с этим
10 ответов · 848 просмотров
Похожие запросы:
как запустить llama локальноqwen vs llama что лучше
Кто сейчас на конференции
Сейчас этот форум просматривают: нет зарегистрированных пользователей и 1 гость