Решённые вопросы — Машинное обучение и Data Science

Решённые вопросы раздела «Машинное обучение и Data Science»: 23 тем с принятым лучшим ответом — готовые проверенные решения сообщества по этой теме.

По разделам: все Карьера в IT 56 AI-ассистированная разработка 55 Локальные LLM и open-source модели 47 Нейрогенерация: изображения и видео 37 Веб-разработка 36 Self-hosting и Homelab 29 DevOps и CI/CD 28 Геймдев и разработка игр 27 Языки программирования 26 Курилка и оффтоп 26 Кибербезопасность и пентест 26 Сборка ПК и комплектующие 25 Базы данных 24 Смартфоны и гаджеты 24 Машинное обучение и Data Science 23 Новости технологий 22 Стартапы и фриланс 22 Облачные платформы 19 Linux и системное администрирование 18 Одноплатники, IoT и DIY-электроника 18 Приватность и шифрование 18 CTF и реверс-инжиниринг 18 Мобильная разработка 17 Статьи и лонгриды 1

Вопросы с решением (23)

Файнтюн Qwen2.5-7B на LoRA жрёт всю память, как влезть в 24гб 3090 ✓ Лучший ответ
Ответ (android_roman): partha писал(а):max_seq_len поставил 2048 а ты уверен что тебе реально нужно 2048 на всех примерах? посчитай распределение длин токенов в датасете. у меня в инструкциях…
в «Машинное обучение и Data Science» · 7 ответов · 69 просмотров
CUDA out of memory — собрал список того, что реально помогает (а не магия) ✓ Лучший ответ
Ответ (tcpmaker): И gradient accumulation вместо большого батча. batch=1, accum=16 даёт эффективный батч 16, а память как у единицы. Удивительно сколько людей про это забывает.
в «Машинное обучение и Data Science» · 9 ответов · 548 просмотров
HR смотрят на Kaggle или на LeetCode при найме в ML? Запутался куда вкладывать вечера ✓ Лучший ответ
Ответ (Tcraw62981): По опыту найма: в продуктовых ML-командах каггл скорее как сигнал 'умеет в данные', но синьоры на собесе всё равно гоняют по системному дизайну ML-пайплайна и по…
в «Машинное обучение и Data Science» · 8 ответов · 682 просмотров
Собесы по DS в 2026: спрашивают про агентов и RAG, а работа — CatBoost и SQL. Куда качаться? ✓ Лучший ответ
Ответ (tim28): Собеседую сам, поясню двойственность. Бизнес массово хочет встроить LLM-фичи в продукты, и команды берут людей с запасом: сегодня ты считаешь отток, завтра тебя…
в «Машинное обучение и Data Science» · 5 ответов · 70 просмотров
Ошибка CUDA out of memory как уменьшить использование памяти GPU ✓ Лучший ответ
Ответ (nashnet): Ещё можно профилировать что именно занимает память: print(torch.cuda.memory_summary()) даёт подробную картину. Часто оказывается что проблема не в батче а в том, что…
в «Машинное обучение и Data Science» · 8 ответов · 75 просмотров
Стоит ли джуну в 2026 идти в ML или поезд уже ушёл? ✓ Лучший ответ
Ответ (ninja_anton): По нашим данным: вакансий с тегом ML/AI стало больше, но требования сместились. Берут не тех кто знает как работает трансформер, а тех кто задеплоит RAG и не уронит…
в «Машинное обучение и Data Science» · 11 ответов · 632 просмотров
uv vs Poetry в 2026 — стоит ли переезжать на новый стандарт? ✓ Лучший ответ
Ответ (vemina): У меня другой опыт. Споткнулся на пакетах которые тянут кастомные системные библиотеки — libsndfile, ffmpeg-python и подобное. uv резолвер иногда выбирал не тот wheel и…
в «Машинное обучение и Data Science» · 5 ответов · 67 просмотров
LoRA vs полный файнтюн в 2026 — кто-нибудь реально видит разницу в качестве? ✓ Лучший ответ
Ответ (alansmit): А full FT хоть в каком случае ещё имеет смысл? Или это полностью legacy?
в «Машинное обучение и Data Science» · 11 ответов · 631 просмотров
Какие метрики реально показывать заказчику, а какие оставить для себя? ✓ Лучший ответ
Ответ (Tracyw): И зафиксируй метрику на отложенной во времени выборке, а не на случайном сплите. Фрод дрейфует, на random split цифры будут завышены и в проде ты обделаешься.
в «Машинное обучение и Data Science» · 10 ответов · 1006 просмотров
GaLore vs LoRA для full-parameter fine-tuning — кто-нибудь щупал в реальных задачах? ✓ Лучший ответ
Ответ (Tcraw62981): Тестировал GaLore vs LoRA r=64 на задаче суммаризации русских новостей, модель Mistral-7B. Результаты честные: GaLore дал ROUGE-L на 1.8 пунктов выше чем LoRA при…
в «Машинное обучение и Data Science» · 8 ответов · 67 просмотров
Как бороться с переобучением нейросети практические методы ✓ Лучший ответ
Ответ (pharside): Если всё вышеперечисленное попробовали — смотрите на early stopping по val loss с patience=10 эпох и уменьшайте архитектуру. Иногда модель просто слишком большая для…
в «Машинное обучение и Data Science» · 6 ответов · 72 просмотров
Поставил все сиды, а loss всё равно гуляет между запусками — кто победил недетерминизм в PyTorch? ✓ Лучший ответ
Ответ (b1llyn0m): @juniorstack ага, seed=42 в ноутбуке на CPU работает прекрасно. А потом ты выкатываешь на мультигпу с DDP и понимаешь что у каждого ранка свой сид нужен, иначе все…
в «Машинное обучение и Data Science» · 17 ответов · 813 просмотров
Перешёл из бэкенда в ML и слегка в шоке — это нормально что 80% времени это данные? ✓ Лучший ответ
Ответ (Macrano): Кстати по рынку: бэкендеры с ML-навыком сейчас ценятся выше чистых DS на джуниор-мидл уровне. Так что ты в хорошей точке, не переживай.
в «Машинное обучение и Data Science» · 8 ответов · 381 просмотров
MLflow или Weights and Biases для трекинга экспериментов что лучше ✓ Лучший ответ
Ответ (delphin): Для соло-проектов могу предложить и более простой путь: TensorBoard встроен в TensorFlow и работает с PyTorch через torch.utils.tensorboard. Нет зависимости от внешних…
в «Машинное обучение и Data Science» · 10 ответов · 91 просмотров
Холивар синтетические данные для обучения это будущее или костыль который убьёт модели ✓ Лучший ответ
Ответ (Austkin): model collapse это про рекурсивное обучение без свежих реальных данных. Если ты подмешиваешь синтетику к реальным данным а не заменяешь их полностью, никакого коллапса…
в «Машинное обучение и Data Science» · 7 ответов · 53 просмотров
vLLM vs Ollama vs TGI для self-hosted инференса — что в проде у вас? ✓ Лучший ответ
Ответ (lhoanii): TGI от HF тоже хорош и проще в проде чем vLLM по моему опыту, особенно если уже в экосистеме HuggingFace. Но vLLM сейчас впереди по throughput и быстрее фичи катит.
в «Машинное обучение и Data Science» · 9 ответов · 875 просмотров
PyTorch vs TensorFlow 2024 что выбрать для нового проекта ✓ Лучший ответ
Ответ (delphin): Вопрос в тему: а как у вас с аннотацией данных? В медицине это обычно узкое место, а не выбор фреймворка. Если датасет маленький — разница между PT и TF вообще…
в «Машинное обучение и Data Science» · 6 ответов · 61 просмотров
Как правильно выбрать метрики качества для задачи классификации ✓ Лучший ответ
Ответ (Macrano): Важный момент про балансировку датасета: SMOTE, class_weight='balanced' в sklearn, или oversampling minority класса. Но это влияет на обучение, а не на метрики оценки…
в «Машинное обучение и Data Science» · 6 ответов · 49 просмотров
Почему результаты обучения PyTorch не воспроизводятся даже с фиксированным seed ✓ Лучший ответ
Ответ (mstrbates): torch.use_deterministic_algorithms(True) ставил? без него куда тебе насыпет недетерминированных кернелов, особенно в свертках и atomic-операциях reduction
в «Машинное обучение и Data Science» · 6 ответов · 45 просмотров
LLM as judge для оценки RAG бота, это карго культ или я что-то не понимаю ✓ Лучший ответ
Ответ (burnedblueteam): а какая модель под капотом? может у вас просто ретривер слабый и оценивать особо нечего
в «Машинное обучение и Data Science» · 6 ответов · 50 просмотров