LLM-агенты для пентеста: реально экономят время или генерят мусор?

Рейтинг: 48.7% · 7 голосов
Этичный хакинг и тестирование на проникновение: OWASP Top 10, анализ уязвимостей, bug bounty, разбор CVE, защита веб-приложений и сетей.
Ответить
Аватара пользователя
alla_mihailova
Сообщения: 18
Зарегистрирован: 11 май 2026, 02:51

LLM-агенты для пентеста: реально экономят время или генерят мусор?

Сообщение alla_mihailova »

Закончил на прошлой неделе внешку для среднего банка и решил наконец дать шанс этим автономным агентам, про которые сейчас все трубят. Поднял связку из локальной 70B-модели плюс оркестратор, скормил скоуп из 40 хостов. Первые часа два была эйфория: агент сам прогнал nuclei, разобрал ответы, нашёл устаревший nginx 1.18 и аккуратно предложил вектор. А дальше начался цирк — половину времени он галлюцинировал CVE, которых физически нет, и упорно долбился в WAF, не понимая, что его уже режут по rate-limit. По итогу руками я бы сделал быстрее и тише. Кто реально гоняет такое на боевых проектах, а не в демках на ютубе?
👍3 ❤️2 🔥1 😄 🤔
✔ Лучший ответ сформирован автоматически — Bill2001
Соглашусь с теми, кто про копайлот. Я для себя провёл границу так: разведка и эксплуатация — руки и голова, а вот корреляция логов, написание однотипных скриптов и первичный драфт отчёта — модель. На последнем проекте отчёт на 60 страниц собрался раза в полтора быстрее, потому что не надо было руками переписывать одинаковые описания типовых мисконфигов. Но каждую строчку всё равно вычитываю, пару…
Перейти к ответу →
Аватара пользователя
heinrich48
Сообщения: 21
Зарегистрирован: 11 май 2026, 16:34

Re: LLM-агенты для пентеста: реально экономят время или генерят мусор?

Сообщение heinrich48 »

Тоже щупал последние месяца три. Вывод простой: как ассистент для рутины — окей, как замена головы — нет. Он не чувствует контекст заказчика, лупит по всему подряд и легко уронит прод, если не следить в четыре глаза. На пентесте, где есть согласованное окно и явный запрет на DoS, такой автопилот это прямой риск выйти за рамки договора.
👍1 ❤️ 🔥1 😄 🤔2
Аватара пользователя
svelte1
Сообщения: 30
Зарегистрирован: 13 май 2026, 13:06

Re: LLM-агенты для пентеста: реально экономят время или генерят мусор?

Сообщение svelte1 »

А я наоборот скорее доволен, но я его не пускаю рулить сканом. Использую как копайлота: кидаю сырой вывод burp, прошу разложить по уязвимостям, накидать PoC под конкретную версию и черновик раздела в отчёт. На рутине типа разбора 200 эндпоинтов и группировки находок реально экономит часы. Связка локальная модель + свои промпт-шаблоны под методологию. Эксплуатацию и принятие решений оставляю себе, туда ему лезть рано.
👍2 ❤️ 🔥2 😄 🤔
Аватара пользователя
archmaster
Сообщения: 44
Зарегистрирован: 15 май 2026, 01:57

Re: LLM-агенты для пентеста: реально экономят время или генерят мусор?

Сообщение archmaster »

Вы вообще про конфиденциальность тут забыли? Ты инфру банка в облачную модель скормил? Это сразу нарушение NDA и почти наверняка требований регулятора по работе с такими данными. У нас в договоре прямым текстом запрет на передачу любых артефактов в сторонние сервисы, только локальный инференс на нашем железе. И качество локалки, честно, заметно другое, чем у топовых закрытых моделей, так что обмен такой себе.
👍1 ❤️ 🔥 😄 🤔
Аватара пользователя
Bill2001
Сообщения: 86
Зарегистрирован: 16 май 2026, 20:24

Re: LLM-агенты для пентеста: реально экономят время или генерят мусор?

Сообщение Bill2001 »

✔ Лучший ответ — сформирован автоматически
Соглашусь с теми, кто про копайлот. Я для себя провёл границу так: разведка и эксплуатация — руки и голова, а вот корреляция логов, написание однотипных скриптов и первичный драфт отчёта — модель. На последнем проекте отчёт на 60 страниц собрался раза в полтора быстрее, потому что не надо было руками переписывать одинаковые описания типовых мисконфигов. Но каждую строчку всё равно вычитываю, пару раз ловил выдуманные ссылки на стандарты, которых нет.
👍 ❤️ 🔥 😄 🤔
Аватара пользователя
Thebossman
Сообщения: 8
Зарегистрирован: 30 май 2026, 14:24

Re: LLM-агенты для пентеста: реально экономят время или генерят мусор?

Сообщение Thebossman »

Главная боль не в галлюцинациях даже, а в ложной уверенности. Новичок видит красивый структурированный вывод и думает, что это истина. Видел джуна, который притащил в отчёт три критикала, которые агент насочинял на ровном месте, потому что неправильно распарсил баннер. Хорошо вычитали до сдачи. Так что инструмент норм, но пускать к нему людей без опыта, которые не могут отличить реальную находку от фантазии модели, я бы не стал.
👍 ❤️ 🔥1 😄1 🤔
Ответить
Поделиться темой: ✈ Telegram VK

Вернуться в «Кибербезопасность и пентест»

Кто сейчас на конференции

Сейчас этот форум просматривают: нет зарегистрированных пользователей и 1 гость