Accuracy 0.97 на проде модель оказалась бесполезной, как мы прокололись на метрике
Рейтинг: 74.2% · 18 голосов
Войдите, чтобы голосовать
Голосовать «За» и «Против» могут только авторизованные пользователи. Войдите в свой аккаунт — или зарегистрируйтесь, это займёт минуту.
Нет аккаунта? Зарегистрироваться
Accuracy 0.97 на проде модель оказалась бесполезной, как мы прокололись на метрике
Выкатили модель кредитного скоринга с accuracy 0.97 на тесте, заказчик доволен, через месяц прод показал что она почти не ловит дефолты. История провала про то как accuracy на несбалансированных данных нас обманула. Дефолтов в выборке было 3%, и модель которая всем подряд ставит не дефолт честно дает 0.97. Делюсь чтобы вы так не влетели.
✔ Лучший ответ сформирован автоматически — envoy69
правильный набор метрик под такую задачу. забудь про accuracy сразу. смотри precision recall по классу дефолта отдельно, и PR-AUC а не ROC-AUC, потому что при 3% позитивов ROC-AUC красиво выглядит даже у слабой модели, а PR-AUC честно проседает. дальше recall по дефолту это твоя бизнес-боль, каждый непойманный дефолт это деньги. но recall в лоб гнать нельзя, утонешь в ложных отказах хорошим клиен…
Re: Accuracy 0.97 на проде модель оказалась бесполезной, как мы прокололись на метрике
@rabbit8, @токсик ну вот в учебнике да, а когда заказчик тычет в 0.97 и говорит отличная модель, попробуй ему на пальцах объяснить про baseline. бизнес видит большое число и радуется. поэтому история и полезная
Re: Accuracy 0.97 на проде модель оказалась бесполезной, как мы прокололись на метрике
✔ Лучший ответ — сформирован автоматически
правильный набор метрик под такую задачу.
забудь про accuracy сразу. смотри precision recall по классу дефолта отдельно, и PR-AUC а не ROC-AUC, потому что при 3% позитивов ROC-AUC красиво выглядит даже у слабой модели, а PR-AUC честно проседает.
дальше recall по дефолту это твоя бизнес-боль, каждый непойманный дефолт это деньги. но recall в лоб гнать нельзя, утонешь в ложных отказах хорошим клиентам. поэтому фиксируешь допустимый precision с бизнесом и максимизируешь recall при нем.
и обязательно подбор порога. дефолтные 0.5 при таком дисбалансе бессмысленны, двигай threshold по PR-кривой под целевой recall.
плюс на скоринге считают экономику напрямую. матрица стоимостей, FN дороже FP в N раз, и оптимизируешь ожидаемые потери в рублях а не абстрактную метрику. так и заказчику объяснять проще, он язык денег понимает.
забудь про accuracy сразу. смотри precision recall по классу дефолта отдельно, и PR-AUC а не ROC-AUC, потому что при 3% позитивов ROC-AUC красиво выглядит даже у слабой модели, а PR-AUC честно проседает.
дальше recall по дефолту это твоя бизнес-боль, каждый непойманный дефолт это деньги. но recall в лоб гнать нельзя, утонешь в ложных отказах хорошим клиентам. поэтому фиксируешь допустимый precision с бизнесом и максимизируешь recall при нем.
и обязательно подбор порога. дефолтные 0.5 при таком дисбалансе бессмысленны, двигай threshold по PR-кривой под целевой recall.
плюс на скоринге считают экономику напрямую. матрица стоимостей, FN дороже FP в N раз, и оптимизируешь ожидаемые потери в рублях а не абстрактную метрику. так и заказчику объяснять проще, он язык денег понимает.
Re: Accuracy 0.97 на проде модель оказалась бесполезной, как мы прокололись на метрике
это прям главное что надо вынести из треда. roc-auc 0.85 на таком дисбалансе выглядит ок, а pr-auc там реально 0.2 и сразу видно что модель никакаяenvoy69 писал(а):PR-AUC а не ROC-AUC, потому что при 3% позитивов ROC-AUC красиво выглядит
- pandas_master
- Сообщения: 11
- Зарегистрирован: 13 май 2026, 02:13
- kernellord
- Сообщения: 6
- Зарегистрирован: 01 июн 2026, 03:48
Поделиться темой:
✈ Telegram
VK
- Похожие темы
-
- Отдал 159к за курс с гарантией трудоустройства. Спойлер: гарантия оказалась с двойным дном
5 ответов · 4 просмотров
-
- Потратил выходные на тонкую настройку llama.cpp и она оказалась медленнее ollama из коробки
6 ответов · 1 просмотров
-
-
- Дообучение llama 3 на русских данных, accuracy выросла а в проде модель тупит
7 ответов · 1 просмотров
Кто сейчас на конференции
Сейчас этот форум просматривают: нет зарегистрированных пользователей и 0 гостей