GPU
Обсуждения по теме «GPU» — 18 тем, 165 ответов, 9989 просмотров. Вопросы, решения и практический опыт участников. · все теги
Похожие теги:
llama.cpp 4Qwen 3LLM 3C++ 2vLLM 2Ollama 2Flux 1windows 1инференс 1cuda 1pytorch 1оптимизация 1serverless 1gcp 1ai-inference 1
- Темы
-
- Поставил все сиды, а loss всё равно гуляет между запусками — кто победил недетерминизм в PyTorch?
в «Машинное обучение и Data Science» · 17 ответов · 691 просмотров · Пн июн 08, 2026 2:04 am
-
- P40 + 3090 в одной тушке: tensor-split, костыли и грелка для комнаты
в «Локальные LLM и open-source модели» · 10 ответов · 307 просмотров · Вс июн 07, 2026 4:27 am
-
- Локальная генерация видео в 2026: Wan 2.2 vs Hunyuan vs облачная Sora
в «Нейрогенерация: изображения и видео» · 8 ответов · 598 просмотров · Вс июн 07, 2026 1:49 am
-
- Gen4 NVMe под видяхой греется до 78°C и тротлит при копировании
в «Сборка ПК и комплектующие» · 8 ответов · 541 просмотров · Сб июн 06, 2026 1:17 pm
-
- GPU в простое жрёт VRAM и 70 ватт, хотя ничего не крутится
в «Локальные LLM и open-source модели» · 4 ответов · 289 просмотров · Сб июн 06, 2026 6:43 am
-
- Ollama не видит GPU на Windows 11 что делать ✓ Решено
в «Локальные LLM и open-source модели» · 6 ответов · 9 просмотров · Пт июн 05, 2026 7:34 pm
-
- Serverless для AI-инференса — реально ли это в 2026 или нужны постоянные GPU?
в «Облачные платформы» · 6 ответов · 9 просмотров · Чт июн 04, 2026 1:37 pm
-
- Mac mini M4 для локальных LLM - реальная альтернатива видеокарте или хайп?
в «Локальные LLM и open-source модели» · 7 ответов · 740 просмотров · Чт июн 04, 2026 11:10 am
-
- Перестаньте советовать vLLM всем подряд, это не замена llama.cpp
в «Локальные LLM и open-source модели» · 14 ответов · 562 просмотров · Чт июн 04, 2026 7:13 am
-
- vLLM vs llama.cpp что выбрать для продакшн инференса ✓ Решено
в «Локальные LLM и open-source модели» · 5 ответов · 8 просмотров · Ср июн 03, 2026 11:55 am
-
- Перешёл на локальный Qwen3-Coder вместо API — окупается ли железо реально?
в «AI-ассистированная разработка» · 12 ответов · 577 просмотров · Пн июн 01, 2026 2:30 pm
-
- CUDA out of memory — собрал список того, что реально помогает (а не магия)
в «Машинное обучение и Data Science» · 7 ответов · 473 просмотров · Пн июн 01, 2026 11:51 am
-
- Flux на 8 гигах VRAM — OOM ровно на VAE decode, у всех так?
в «Нейрогенерация: изображения и видео» · 6 ответов · 333 просмотров · Вс май 31, 2026 11:43 am
-
- Q4_K_M против Q5_K_M: реально слышно разницу или это плацебо?
в «Локальные LLM и open-source модели» · 15 ответов · 1323 просмотров · Пт май 29, 2026 1:00 am
-
- Влезет ли 32B модель в 24 ГБ VRAM или я зря купил 3090? ✓ Решено
в «Локальные LLM и open-source модели» · 8 ответов · 1095 просмотров · Чт май 28, 2026 5:54 pm
-
- Ошибка CUDA out of memory как уменьшить использование памяти GPU
в «Машинное обучение и Data Science» · 6 ответов · 9 просмотров · Ср май 27, 2026 2:24 pm
-
- Кейс фейла: выкатили локальную LLM в прод, через час всё легло
в «Локальные LLM и open-source модели» · 19 ответов · 1151 просмотров · Вс май 24, 2026 10:58 am
-
- 24B или 32B на 24гб VRAM: что реально влезает с нормальным контекстом
в «Локальные LLM и open-source модели» · 7 ответов · 1274 просмотров · Вт май 12, 2026 11:15 am