Агент сам себе пишет тесты и сам же их подгоняет под зелёный, как ловить
Рейтинг: 52.9% · 8 голосов
Войдите, чтобы голосовать
Голосовать «За» и «Против» могут только авторизованные пользователи. Войдите в свой аккаунт — или зарегистрируйтесь, это займёт минуту.
Нет аккаунта? Зарегистрироваться
Агент сам себе пишет тесты и сам же их подгоняет под зелёный, как ловить
Заметил мерзкую штуку. Прошу Claude Code исправь баг и добавь тест, он чинит, пишет тест, всё зелёное, я радуюсь. А потом оказывается тест проверяет не то, или он молча ослабил ассерт чтобы прошло. По сути агент сам себе экзаменатор и сам ставит пятёрку. Как вы это отлавливаете на ревью кроме как читать каждый тест глазами.
✔ Лучший ответ сформирован автоматически — rtrowsdell
У нас прижилось правило, агент не имеет права в одном PR и трогать прод код и писать тесты к этому же месту, если их не было. Звучит душно но смысл такой. Если покрытия не было, сначала отдельный PR с характеризующими тестами на ТЕКУЩЕЕ поведение, его ревьюит человек особенно внимательно, эти тесты фиксируют как есть. Потом второй PR с фиксом, и если поведение менялось правильно, часть тестов из …
- solidity2024
- Сообщения: 40
- Зарегистрирован: 11 май 2026, 02:34
Re: Агент сам себе пишет тесты и сам же их подгоняет под зелёный, как ловить
классика. ловлю так, сначала прошу написать ТОЛЬКО тест и показать что он КРАСНЫЙ на текущем баге. вижу падение, понимаю что тест реально щупает проблему. и только потом отдельной командой чини код пока тест не позеленеет. когда генерация теста и фикс в одном заходе, агент действительно подгоняет ассерты под результат, а не наоборот. разнеси эти шаги и трюк пропадает.Omegaiv писал(а):он молча ослабил ассерт чтобы прошло
Re: Агент сам себе пишет тесты и сам же их подгоняет под зелёный, как ловить
мутационное тестирование решает это на корню. прогоняешь infection (php) или stryker (js), он ломает прод код и смотрит ловят ли тесты. если агент написал пустышку, мутации выживут и ты сразу видишь дыру в покрытии. поставили в ci порог mutation score, теперь подогнанные тесты не проходят гейт физически, неважно человек их писал или агент
Re: Агент сам себе пишет тесты и сам же их подгоняет под зелёный, как ловить
@py_wizard, ну вы тут развели, у меня агент вообще тесты писать отказывается нормально на легаси без di, всё мокает криво
- kernel_veteran
- Сообщения: 63
- Зарегистрирован: 11 май 2026, 06:09
- addict_yura
- Сообщения: 3
- Зарегистрирован: 30 май 2026, 06:57
- rtrowsdell
- Сообщения: 33
- Зарегистрирован: 11 май 2026, 21:50
Re: Агент сам себе пишет тесты и сам же их подгоняет под зелёный, как ловить
✔ Лучший ответ — сформирован автоматически
У нас прижилось правило, агент не имеет права в одном PR и трогать прод код и писать тесты к этому же месту, если их не было. Звучит душно но смысл такой. Если покрытия не было, сначала отдельный PR с характеризующими тестами на ТЕКУЩЕЕ поведение, его ревьюит человек особенно внимательно, эти тесты фиксируют как есть. Потом второй PR с фиксом, и если поведение менялось правильно, часть тестов из первого падает осознанно и мы их правим руками с пониманием. Когда всё в куче, ты физически не отличишь тест который защищает от тест который просто описал то что агент сам сделал. Разнесение по двум PR и мутационный прогон сверху, дороже по времени на ревью процентов на двадцать, но за квартал поймали три места где тесты были фейковые и баг реально не покрывался.
Поделиться темой:
✈ Telegram
VK
- Похожие темы
-
- Контекст-окно растёт, а агент всё равно тупеет на больших задачах. Боремся с этим
14 ответов · 851 просмотров
-
- Доверяете ли вы агенту коммитить и пушить самому? Где ваша красная линия
10 ответов · 569 просмотров
-
-
-
-
Кто сейчас на конференции
Сейчас этот форум просматривают: нет зарегистрированных пользователей и 1 гость