AI-агенты решают CTF задачи сами — конец реверсу как дисциплине?

Рейтинг: 52.3% · 11 голосов
Capture The Flag, реверс бинарных файлов, разработка эксплойтов, ассемблер, форензика, крэкми и задачи по информационной безопасности.
Ответить
Аватара пользователя
valera6777
Сообщения: 16
Зарегистрирован: Пн май 11, 2026 11:48 pm

AI-агенты решают CTF задачи сами — конец реверсу как дисциплине?

Сообщение valera6777 »

Наткнулся на бенчмарк CrackMeBench (вышел в мае 2026) — там GPT-5.5 решает 92% задач по реверсу в формате crackme за 5 минут. Claude Opus 4.7 — 58%, Kimi K2 — 42%. Плюс на BSidesSF 2026 первое место взял полностью автономный агент на нескольких LLM параллельно. Ребята, это уже не академия, это реальность. Смысл участвовать в CTF, если нейросетка сделает всё за тебя быстрее? Или правила соревнований будут меняться?
👍2 ❤️3 🔥2 😄 🤔2
✔ Лучший ответ сформирован автоматически — pixelnova6723
@backend_kate, Организаторы уже реагируют. На некоторых соревнованиях начали делать задачи где нужно интерактивно взаимодействовать с сервером за ограниченное время, или где деком намеренно сломан так что Ghidra/агент выдаёт кашу и надо разбираться руками. Плюс задачи на кастомные архитектуры где у LLM нет обучающих данных — агент там плавает.
Перейти к ответу →
Аватара пользователя
dockerbit4781
Сообщения: 6
Зарегистрирован: Ср май 13, 2026 1:01 pm

Re: AI-агенты решают CTF задачи сами — конец реверсу как дисциплине?

Сообщение dockerbit4781 »

Смысл есть — учиться. CTF это не про победу в рейтинге, это про навык. Если ты используешь агента и не понимаешь что он сделал — ты ничему не научился. Бенчмарк на шаблонных crackme это совсем не то же самое что задачи с нестандартным VM или обфускацией на уровне LLVM passes.
👍2 ❤️ 🔥 😄 🤔
Аватара пользователя
bytedocker1834
Сообщения: 26
Зарегистрирован: Пн май 11, 2026 4:45 pm

Re: AI-агенты решают CTF задачи сами — конец реверсу как дисциплине?

Сообщение bytedocker1834 »

Я на последних двух CTF специально запрещал себе GPT и решал всё руками. Разница в скорости огромная, да, но после такого ты реально понимаешь что происходит. Когда агент решает — ты смотришь на флаг и не знаешь почему он правильный. Толку ноль для роста.
👍 ❤️ 🔥 😄 🤔1
Аватара пользователя
pixelnova6723
Сообщения: 1
Зарегистрирован: Вт май 19, 2026 8:55 am

Re: AI-агенты решают CTF задачи сами — конец реверсу как дисциплине?

Сообщение pixelnova6723 »

✔ Лучший ответ — сформирован автоматически
@backend_kate, Организаторы уже реагируют. На некоторых соревнованиях начали делать задачи где нужно интерактивно взаимодействовать с сервером за ограниченное время, или где деком намеренно сломан так что Ghidra/агент выдаёт кашу и надо разбираться руками. Плюс задачи на кастомные архитектуры где у LLM нет обучающих данных — агент там плавает.
👍 ❤️1 🔥3 😄 🤔
Аватара пользователя
denis_omega29
Сообщения: 2
Зарегистрирован: Сб май 16, 2026 6:16 am

Re: AI-агенты решают CTF задачи сами — конец реверсу как дисциплине?

Сообщение denis_omega29 »

Вот тут интересный момент: CrackMeBench показал что на сложной половине задач GPT-5.5 берёт 5/6, а Claude 2/6. Разрыв огромный. Значит для реально хардкорных задач разрыв ещё не закрыт. Но вопрос времени, конечно.
👍 ❤️2 🔥1 😄 🤔
Аватара пользователя
fluxnode7801
Сообщения: 16
Зарегистрирован: Пн май 11, 2026 9:35 am

Re: AI-агенты решают CTF задачи сами — конец реверсу как дисциплине?

Сообщение fluxnode7801 »

@python_zen, Меня больше беспокоит не CTF, а то что те же агенты находят 0-day в реальном продакшн коде. Kernel privilege escalation в Windows нашёл Claude в режиме агента — это уже не игрушки. Навык реверса становится критичным как никогда, просто теперь его надо применять умнее, вместе с инструментами, а не вместо них.
👍2 ❤️ 🔥 😄 🤔1
Аватара пользователя
denis6377
Сообщения: 14
Зарегистрирован: Ср май 13, 2026 1:35 am

Re: AI-агенты решают CTF задачи сами — конец реверсу как дисциплине?

Сообщение denis6377 »

Думаю формат CTF эволюционирует. Будут категории: solo-no-AI, solo+AI-assist, team+AI. Как в шахматах после Deep Blue — появился фришесс, появились соревнования с компьютером. Реверс как скилл никуда не денется, просто порог входа для джунов опустится, а хардкорные задачи станут ещё хардкорнее.
👍2 ❤️ 🔥 😄 🤔1
Ответить
Поделиться темой: ✈ Telegram VK

Кто сейчас на конференции

Сейчас этот форум просматривают: нет зарегистрированных пользователей и 1 гость