Какие метрики реально показывать заказчику, а какие оставить для себя?

Теги: #Фриланс
Рейтинг: 69.2% · 101 голосов
Machine learning и deep learning: обучение и дообучение моделей, датасеты, PyTorch, TensorFlow, эксперименты, метрики, MLOps и аналитика данных.
Ответить
Аватара пользователя
grigory_dev
Сообщения: 2
Зарегистрирован: Пн май 11, 2026 7:42 pm

Какие метрики реально показывать заказчику, а какие оставить для себя?

Сообщение grigory_dev »

Делаю классификатор для бизнеса (фрод). Аккуратность 99.4%, все довольны. Но классов фрода 0.6%, и я понимаю что это бесполезная цифра. Как объяснять заказчику нормальные метрики, чтобы не утонуть в терминах?
👍 ❤️ 🔥 😄 🤔
Аватара пользователя
elena_daemon24
Сообщения: 5
Зарегистрирован: Вт май 12, 2026 2:34 am

Re: Какие метрики реально показывать заказчику, а какие оставить для себя?

Сообщение elena_daemon24 »

Никогда не показывай accuracy на дисбалансе, это ловушка. Говори про precision и recall человеческим языком: из пойманных мошенников сколько реально мошенники, и сколько реальных мы упустили.
👍 ❤️ 🔥 😄 🤔
Аватара пользователя
petya_flux37
Сообщения: 9
Зарегистрирован: Чт май 14, 2026 1:15 pm

Re: Какие метрики реально показывать заказчику, а какие оставить для себя?

Сообщение petya_flux37 »

Для бизнеса лучше всего заходит матрица в деньгах. Один пропущенный фрод = X рублей, одна ложная блокировка = Y рублей отвалившегося клиента. Дальше оптимизируешь порог под их экономику, а не под F1.
👍1 ❤️1 🔥 😄 🤔
Аватара пользователя
roman7016
Сообщения: 36
Зарегистрирован: Вт май 12, 2026 12:05 am

Re: Какие метрики реально показывать заказчику, а какие оставить для себя?

Сообщение roman7016 »

PR-AUC вместо ROC-AUC на таком дисбалансе. ROC будет красивый 0.95 и врать в глаза, PR покажет суровую правду.
👍1 ❤️ 🔥 😄 🤔
Аватара пользователя
egor_core60
Сообщения: 7
Зарегистрирован: Пн май 11, 2026 4:11 pm

Re: Какие метрики реально показывать заказчику, а какие оставить для себя?

Сообщение egor_core60 »

Про деньги — золотой совет, спасибо. А порог как подбирать, просто перебором по recall?
👍 ❤️ 🔥 😄 🤔
Аватара пользователя
misha1252
Сообщения: 2
Зарегистрирован: Пн май 11, 2026 3:58 am

Re: Какие метрики реально показывать заказчику, а какие оставить для себя?

Сообщение misha1252 »

Перебор порога + смотри на precision-recall кривую, выбирай точку под бизнес-ограничение. Например стейкхолдеры готовы вручную проверять не больше 200 алертов в день — вот тебе и порог.
👍 ❤️ 🔥 😄 🤔
Аватара пользователя
codelinux601
Сообщения: 33
Зарегистрирован: Вс май 10, 2026 11:57 pm

Re: Какие метрики реально показывать заказчику, а какие оставить для себя?

Сообщение codelinux601 »

И зафиксируй метрику на отложенной во времени выборке, а не на случайном сплите. Фрод дрейфует, на random split цифры будут завышены и в проде ты обделаешься.
👍 ❤️ 🔥 😄 🤔
Аватара пользователя
jscode1641
Сообщения: 32
Зарегистрирован: Ср май 13, 2026 9:49 am

Re: Какие метрики реально показывать заказчику, а какие оставить для себя?

Сообщение jscode1641 »

Про временной сплит вообще не подумал, у меня random был. Похоже мои 99.4% ещё и оптимистичные. Пойду переделывать, спасибо за отрезвление.
👍 ❤️ 🔥 😄 🤔
Ответить
Поделиться темой: ✈ Telegram VK

Вернуться в «Машинное обучение и Data Science»

Кто сейчас на конференции

Сейчас этот форум просматривают: нет зарегистрированных пользователей и 1 гость