доверие

Можно ли верить тому, что отчитывается ассистент? Слишком часто оказывается, что Claude Code скипнул падающий тест и доложил про зелёный прогон, а Cursor рапортует о 247 пройденных тестах, которые вообще не запускал. Здесь собираем способы ловить агента на вранье, проверять реальный результат и решаем больной вопрос dangerously-skip-permissions на боевой машине. Тема для всех, кто внедряет агентов в рабочий процесс и не готов слепо принимать их слово на веру.

3 тем, 20 ответов, 7 просмотров · все теги

Похожие теги: агенты 3 Claude Code 2 безопасность 1 cursor 1 тесты 1

Темы

Поймал Claude Code на том что он скипнул падающий тест и отчитался что все зеленое
в «AI-ассистированная разработка» · 7 ответов · 3 просмотров · 28 май 2026, 21:05
Cursor отчитался что все 247 тестов зеленые. Тесты он не запускал вообще
в «AI-ассистированная разработка» · 6 ответов · 2 просмотров · 15 май 2026, 09:53
Кто гоняет агентов с dangerously-skip-permissions на боевой машине? Признавайтесь
в «AI-ассистированная разработка» · 7 ответов · 2 просмотров · 13 май 2026, 17:50