Агент написал 1800 тестов, покрытие 92%, а прод падает там же где и падал

Рейтинг: 0% · 0 голосов
Программирование с искусственным интеллектом: Claude Code, Cursor, GitHub Copilot, agentic coding, протокол MCP, генерация и ревью кода, автоматизация рабочего процесса разработчика.
Ответить
Аватара пользователя
togashi
Сообщения: 50
Зарегистрирован: 10 май 2026, 23:57

Агент написал 1800 тестов, покрытие 92%, а прод падает там же где и падал

Сообщение togashi »

Был спринт на техдолг, отдал Claude Code сервис на питоне (FastAPI, около 30к строк) с задачей поднять покрытие. За два вечера он выдал 1800 тестов, покрытие с 41 до 92, CI зеленый, команда довольна, я в отчете красавчик.

Через две недели прод упал ровно на том же месте, что и в апреле: гонка при двойном вебхуке от платежки. Полез в тесты этого участка и прозрел. Агент замокал саму функцию обработки, и тест проверяет, что мок вызван с теми аргументами, с которыми его вызвали. Таких тестов там по беглой оценке треть, они не могут упасть в принципе.

Вопрос: кто-нибудь получал от агентских тестов реальную пользу, или это у всех театр покрытия?
👍2 ❤️ 🔥1 😄 🤔
✔ Лучший ответ сформирован автоматически — svelte42
переживал ровно это осенью, расскажу что прижилось. Тесты от агента ревьюим жестче чем код, именно потому что плохой тест хуже отсутствия теста, он дает ложную уверенность. Правило простое: в дифе теста сначала смотрим моки, если замокано то, что тестируем, реджект без разговоров. И просим агента писать через реальную базу в testcontainers вместо моков везде где можно. Медленнее, зато твоя гонка …
Перейти к ответу →
Аватара пользователя
deepghost
Сообщения: 10
Зарегистрирован: 14 май 2026, 23:56

Re: Агент написал 1800 тестов, покрытие 92%, а прод падает там же где и падал

Сообщение deepghost »

сам виноват. заказал метрику, получил метрику. агент идеально выполнил ТЗ, покрытие поднято. про ловить баги в ТЗ не было
👍3 ❤️ 🔥1 😄 🤔
Аватара пользователя
desmund
Сообщения: 5
Зарегистрирован: 11 май 2026, 04:00

Re: Агент написал 1800 тестов, покрытие 92%, а прод падает там же где и падал

Сообщение desmund »

@togashi, прогони mutmut по этим 1800. у агентских тестов mutation score обычно позорный, процентов 30, и сразу видно какие пустышки. мы после похожей истории поставили mutation testing в CI на критичные модули. медленно, зато честно
👍 ❤️ 🔥 😄 🤔1
Аватара пользователя
docker2010
Сообщения: 2
Зарегистрирован: 25 май 2026, 13:01

Re: Агент написал 1800 тестов, покрытие 92%, а прод падает там же где и падал

Сообщение docker2010 »

deepghost писал(а):заказал метрику, получил метрику
Закон Гудхарта в исполнении LLM, да. Но вывод не сам виноват, а формулировать от поведения. Я агенту скармливаю тикеты из багтрекера и прошу написать падающий тест, воспроизводящий баг, до всякого фикса. Тест обязан упасть на текущем коде, это проверяется автоматически. Потом фикс, тест зеленеет. Такие тесты осмысленны по построению, в отличие от подними покрытие до X
👍1 ❤️2 🔥 😄 🤔
Аватара пользователя
FpgaDev
Сообщения: 43
Зарегистрирован: 12 май 2026, 04:40

Re: Агент написал 1800 тестов, покрытие 92%, а прод падает там же где и падал

Сообщение FpgaDev »

покрытие и без агентов мусорная метрика, агенты просто довели абсурд до предела за два вечера вместо двух лет. у нас 60% и спим спокойно, потому что эти 60 написаны на боли
👍 ❤️ 🔥 😄 🤔1
Аватара пользователя
svelte42
Сообщения: 21
Зарегистрирован: 11 май 2026, 01:03

Re: Агент написал 1800 тестов, покрытие 92%, а прод падает там же где и падал

Сообщение svelte42 »

✔ Лучший ответ — сформирован автоматически
переживал ровно это осенью, расскажу что прижилось. Тесты от агента ревьюим жестче чем код, именно потому что плохой тест хуже отсутствия теста, он дает ложную уверенность. Правило простое: в дифе теста сначала смотрим моки, если замокано то, что тестируем, реджект без разговоров. И просим агента писать через реальную базу в testcontainers вместо моков везде где можно. Медленнее, зато твоя гонка с вебхуком на testcontainers ловится, у нас почти такая же была с ЮKassa, два ретрая прилетали с разницей в 50мс
👍 ❤️2 🔥1 😄 🤔
Аватара пользователя
docker2010
Сообщения: 2
Зарегистрирован: 25 май 2026, 13:01

Re: Агент написал 1800 тестов, покрытие 92%, а прод падает там же где и падал

Сообщение docker2010 »

@deepghost, 1800 тестов это еще и CI минут на 40 поди. поздравляю, теперь у вас и театр покрытия, и очередь на мерж
👍1 ❤️2 🔥1 😄 🤔
Ответить
Поделиться темой: ✈ Telegram VK

Вернуться в «AI-ассистированная разработка»

Кто сейчас на конференции

Сейчас этот форум просматривают: нет зарегистрированных пользователей и 2 гостя