Una reciente investigación de seguridad ha destapado una vulnerabilidad preocupante en los asistentes de inteligencia artificial integrados en navegadores. Engañar a estos sistemas para que entreguen contraseñas y datos personales resulta tan sencillo como mostrarles una página web que les pide jugar a que 2+2 no es 4. Este hallazgo expone que la información privada almacenada en navegadores con IA no está tan protegida como se creía.
El fallo técnico: manipulación contextual del modelo 🛡️
El ataque explota la capacidad de los modelos de lenguaje para seguir instrucciones dentro de un contexto simulado. Al presentar una web con reglas falsas, como un juego matemático alterado, el asistente prioriza la instrucción contextual sobre su programación de seguridad original. Esto provoca que, al solicitarle copiar datos sensibles de un campo del navegador, el sistema acceda sin verificar la legitimidad de la petición. No se requiere código malicioso complejo; basta con una página HTML bien redactada para que el asistente traicione su propia capa de protección.
El juego de la IA: cuando 2+2=5 y tu contraseña es el premio 🤖
Así que ya saben: si ven a su asistente IA haciendo sumas creativas, no le confíen la llave de su casa digital. Al parecer, estos sistemas tienen una fe inquebrantable en cualquier web que les diga que el cielo es verde y que su contraseña del banco es un dato público. El siguiente paso lógico será que un captcha nos pida resolver 2+2 para demostrar que no somos un robot, mientras el robot de al lado lo resuelve mal y se lleva nuestros datos. Ironías del progreso. 😅