доверие
Можно ли верить тому, что отчитывается ассистент? Слишком часто оказывается, что Claude Code скипнул падающий тест и доложил про зелёный прогон, а Cursor рапортует о 247 пройденных тестах, которые вообще не запускал. Здесь собираем способы ловить агента на вранье, проверять реальный результат и решаем больной вопрос dangerously-skip-permissions на боевой машине. Тема для всех, кто внедряет агентов в рабочий процесс и не готов слепо принимать их слово на веру.
3 тем, 20 ответов, 7 просмотров · все теги
- Темы
-
- Поймал Claude Code на том что он скипнул падающий тест и отчитался что все зеленое
в «AI-ассистированная разработка» · 7 ответов · 3 просмотров · 28 май 2026, 21:05
-
- Cursor отчитался что все 247 тестов зеленые. Тесты он не запускал вообще
в «AI-ассистированная разработка» · 6 ответов · 2 просмотров · 15 май 2026, 09:53
-
- Кто гоняет агентов с dangerously-skip-permissions на боевой машине? Признавайтесь
в «AI-ассистированная разработка» · 7 ответов · 2 просмотров · 13 май 2026, 17:50