Локальные LLM и open-source модели
Запуск больших языковых моделей локально: Llama, Mistral, Qwen, DeepSeek, Gemma. Квантизация GGUF, Ollama, llama.cpp, vLLM, LM Studio, выбор GPU и оптимизация инференса.
Запускаете нейросети на своём железе без подписок и облаков? Обсуждаем локальный инференс LLM — Llama, Mistral, Qwen, DeepSeek и Gemma, квантизацию в GGUF, связки Ollama, llama.cpp, vLLM и LM Studio. Делимся опытом подбора GPU, ускорения генерации и тонкой настройки моделей под свои задачи. Заходите за бенчмарками, конфигами и живыми советами.
-
- Темы
- Ответы
- Просмотры
- Последнее сообщение
-
- 6 Ответы
- 11 Просмотры
-
Последнее сообщение anna2444
-
- 0 Ответы
- 5 Просмотры
-
Последнее сообщение grigory2566
-
- 10 Ответы
- 308 Просмотры
-
Последнее сообщение artem_node41
-
- 6 Ответы
- 9 Просмотры
-
Последнее сообщение julia9067
-
- 4 Ответы
- 289 Просмотры
-
Последнее сообщение yaroslav_vector30
-
- 6 Ответы
- 493 Просмотры
-
Последнее сообщение pynode5808
-
- 6 Ответы
- 9 Просмотры
-
Последнее сообщение kirill_backend
-
- 7 Ответы
- 2300 Просмотры
-
Последнее сообщение matvey5196
-
- 8 Ответы
- 411 Просмотры
-
Последнее сообщение flowgo4491
-
- 7 Ответы
- 740 Просмотры
-
Последнее сообщение fedor_tcp
-
- 14 Ответы
- 562 Просмотры
-
Последнее сообщение cachego9376
-
- 5 Ответы
- 8 Просмотры
-
Последнее сообщение goroot6728
-
- 6 Ответы
- 803 Просмотры
-
Последнее сообщение milana_flow
-
- 6 Ответы
- 9 Просмотры
-
Последнее сообщение stas_stack90
-
- 6 Ответы
- 9 Просмотры
-
Последнее сообщение ivan_omega
-
- 5 Ответы
- 8 Просмотры
-
Последнее сообщение artem_node41
-
- 15 Ответы
- 1323 Просмотры
-
Последнее сообщение matvey5884
-
- 8 Ответы
- 1095 Просмотры
-
Последнее сообщение omegaai1991
-
- 7 Ответы
- 1006 Просмотры
-
Последнее сообщение roman2149
-
- 19 Ответы
- 1151 Просмотры
-
Последнее сообщение ksenia_dns
-
- 5 Ответы
- 8 Просмотры
-
Последнее сообщение liza_ai42
-
- 5 Ответы
- 8 Просмотры
-
Последнее сообщение semyon7320
-
- 5 Ответы
- 8 Просмотры
-
Последнее сообщение mllinux2059
-
- 7 Ответы
- 756 Просмотры
-
Последнее сообщение german_neon
-
- 7 Ответы
- 979 Просмотры
-
Последнее сообщение gocrypto3721
- Темы этого раздела все теги →
GPU10
Ollama9
llama.cpp9
LLM5
vLLM5
C++4
Qwen3
квантизация3
бенчмарки2
vram2
gguf2
DeepSeek2
качество1
Q5_K_M1
MoE1
Qwen31
RTX40901
API1
ram1
настройка1
промпт1
modelfile1
конвертация1
инференс1
- Популярные запросы раздела
Кто сейчас на конференции
Сейчас этот форум просматривают: нет зарегистрированных пользователей и 1 гость