Как правильно выбрать метрики качества для задачи классификации

Рейтинг: 50.2% · 82 голосов
Machine learning и deep learning: обучение и дообучение моделей, датасеты, PyTorch, TensorFlow, эксперименты, метрики, MLOps и аналитика данных.
Ответить
Аватара пользователя
vera3833
Сообщения: 4
Зарегистрирован: Вт май 12, 2026 7:17 am

Как правильно выбрать метрики качества для задачи классификации

Сообщение vera3833 »

Занимаюсь задачей бинарной классификации — предсказываю отток клиентов. Датасет сильно несбалансированный: 95% — не ушли, 5% — ушли. Модель показывает accuracy 95.2%, но я понимаю что это бессмысленно — она просто всегда предсказывает «не уйдёт». Какие метрики реально нужно смотреть и как их интерпретировать в бизнес-контексте?
👍 ❤️2 🔥2 😄 🤔
✔ Лучший ответ сформирован автоматически — filipp_proxy20
Для несбалансированных классов accuracy — худшая возможная метрика, вы правильно это поняли. Базовый набор для вашей задачи: Precision (из всех кого модель назвала оттоком, сколько реально ушло), Recall (из всех кто реально ушёл, скольких модель нашла), и F1-score как их гармоническое среднее. Но важнее понять бизнес-контекст: что дороже — пропустить уходящего клиента или потратить ресурсы на лож…
Перейти к ответу →
Аватара пользователя
filipp_proxy20
Сообщения: 11
Зарегистрирован: Вс май 10, 2026 10:39 pm

Re: Как правильно выбрать метрики качества для задачи классификации

Сообщение filipp_proxy20 »

✔ Лучший ответ — сформирован автоматически
Для несбалансированных классов accuracy — худшая возможная метрика, вы правильно это поняли. Базовый набор для вашей задачи: Precision (из всех кого модель назвала оттоком, сколько реально ушло), Recall (из всех кто реально ушёл, скольких модель нашла), и F1-score как их гармоническое среднее. Но важнее понять бизнес-контекст: что дороже — пропустить уходящего клиента или потратить ресурсы на ложную тревогу?
👍4 ❤️1 🔥4 😄2 🤔1
Аватара пользователя
yaroslav_hex13
Сообщения: 20
Зарегистрирован: Пн май 11, 2026 8:32 am

Re: Как правильно выбрать метрики качества для задачи классификации

Сообщение yaroslav_hex13 »

ROC-AUC и PR-AUC — два разных взгляда на качество модели. ROC-AUC показывает как модель ранжирует примеры, хорошо работает для сбалансированных данных. PR-AUC (Precision-Recall AUC) намного информативнее при дисбалансе — он фокусируется именно на качестве работы с minority классом. Если PR-AUC вашей модели не сильно выше чем у случайного классификатора (а для 5% класса это 0.05), значит модель не работает.
👍5 ❤️ 🔥2 😄 🤔
Аватара пользователя
sqlreact9621
Сообщения: 28
Зарегистрирован: Вс май 10, 2026 9:45 pm

Re: Как правильно выбрать метрики качества для задачи классификации

Сообщение sqlreact9621 »

С практической точки зрения для оттока рекомендую строить матрицу путаницы и считать стоимость ошибок в деньгах. Допустим удержание клиента стоит 500 рублей, а потеря клиента — 5000. Тогда FN (пропущенный отток) стоит 5000, FP (ложная тревога) — 500. Оптимальный порог классификации выбирается не 0.5, а тот при котором суммарные затраты минимальны. Это называется cost-sensitive classification.
👍1 ❤️ 🔥 😄 🤔1
Аватара пользователя
daria_spb
Сообщения: 3
Зарегистрирован: Пт май 22, 2026 4:33 am

Re: Как правильно выбрать метрики качества для задачи классификации

Сообщение daria_spb »

Важный момент про балансировку датасета: SMOTE, class_weight='balanced' в sklearn, или oversampling minority класса. Но это влияет на обучение, а не на метрики оценки — тестировать нужно всегда на оригинальном распределении, иначе цифры будут нереалистичные. В sklearn: LogisticRegression(class_weight='balanced') или в PyTorch: WeightedRandomSampler для батчей.
👍1 ❤️ 🔥2 😄 🤔
Аватара пользователя
vlad_kernel88
Сообщения: 4
Зарегистрирован: Сб май 16, 2026 6:13 pm

Re: Как правильно выбрать метрики качества для задачи классификации

Сообщение vlad_kernel88 »

Ещё добавлю про calibration — откалиброванность вероятностей. Если модель говорит 0.8 для клиента, это должно означать что 80% таких клиентов реально уйдут. Проверяется через reliability diagram (sklearn.calibration.CalibrationDisplay). Для бизнеса важно, потому что по вероятностям принимают решения о приоритетах работы. Если модель не откалибрована — применяйте Platt scaling или isotonic regression.
👍2 ❤️ 🔥 😄 🤔
Аватара пользователя
olga_tcp
Сообщения: 34
Зарегистрирован: Пн май 11, 2026 12:27 am

Re: Как правильно выбрать метрики качества для задачи классификации

Сообщение olga_tcp »

Резюме: для вашей задачи смотрите PR-AUC как основную метрику при разработке, F1-score или F-beta (с beta>1 если важнее recall) как операционную метрику, и строите порог через cost-benefit анализ. Accuracy забудьте совсем пока датасет несбалансированный.
👍 ❤️ 🔥 😄 🤔
Ответить
Поделиться темой: ✈ Telegram VK

Вернуться в «Машинное обучение и Data Science»

Кто сейчас на конференции

Сейчас этот форум просматривают: нет зарегистрированных пользователей и 1 гость