GuardFall: у открытого искусственного интеллекта есть ахиллесова пята

Исследование GuardFall выявило проблему безопасности в агентах искусственного интеллекта с открытым исходным кодом, используемых для программирования. Эти системы уязвимы для атак с внедрением команд — ошибки, которая существует в компьютерном мире уже десятилетиями. Для обычных пользователей это означает, что приложения и цифровые сервисы, созданные с помощью этих инструментов, могут содержать бреши в безопасности, подвергая риску личные данные и увеличивая опасность кибератак.

Уязвимость безопасности GuardFall в агентах ИИ с открытым исходным кодом для программирования, рука гуманоидного робота печатает на клавиатуре ноутбука, в то время как вредоносный код внедрения команд вытекает с экрана в виде светящихся красных цифровых нитей, нити обвивают руку робота и проникают в чип CPU на открытой материнской плате, инженерная визуализация, кибератака в процессе, голографические значки замков разбиваются, темный фон серверной с мигающими светодиодами, фотореалистичный кинематографический рендер, драматическое синее и красное освещение, сверхдетализированные дорожки печатной платы, высококонтрастные тени

Внедрение команд: старый трюк, который всё ещё работает 🔐

Внедрение команд — не новая техника: она позволяет атакующему вводить вредоносные инструкции в систему, которая их не фильтрует. В случае с ИИ-ассистентами для разработки ошибка возникает, когда модель интерпретирует как действительные команды данные, которые не должна обрабатывать. Исследователи GuardFall продемонстрировали, что, обманув агента специальными входными данными, можно заставить его выполнять нежелательные действия. Решение заключается во внедрении строгих проверок и обновлении протоколов безопасности в этих средах с открытым исходным кодом.

ИИ учится программировать, но не запирать дверь на замок 🤖

Любопытно, что эти инструменты, предназначенные для написания кода без ошибок, попадаются в такую же старую ловушку, как и сам интернет. В то время как ИИ-ассистенты обещают автоматизировать сложные задачи, оказывается, что простая замаскированная команда сбивает их с пути, как стажера в первый день. В конечном итоге урок заключается в том, что искусственный интеллект всё ещё нуждается в том, чтобы люди напоминали ему об основах: не доверять всему, что ему говорят, даже если это приходит в виде промпта.