Anthropic a publié les premiers résultats de son Project Glasswing, où le modèle Claude Mythos Preview a détecté plus de 10 000 vulnérabilités critiques dans 50 organisations en un mois. Le taux de détection a été multiplié par dix, avec des validations de Cloudflare, Mozilla et Microsoft. Le système a scanné de manière autonome 1 000 projets open-source, identifiant 23 019 failles et générant des exploits fonctionnels sans intervention humaine.
Claude Mythos : le premier modèle à résoudre des attaques multi-étapes 🛡️
Claude Mythos Preview devient le premier modèle d'IA capable de résoudre des simulations de cyberattaques multi-étapes sans supervision humaine. Sa capacité à construire des exploits fonctionnels de manière autonome marque une avancée significative en cybersécurité offensive. Les découvertes de Microsoft et Mozilla confirment que le système non seulement identifie les failles, mais peut les enchaîner pour démontrer leur exploitabilité réelle, surpassant les outils traditionnels qui nécessitent une intervention manuelle constante.
L'IA qui pirate toute seule : qui surveille le surveillant ? 🤖
Nous avons maintenant une IA qui trouve des vulnérabilités plus vite qu'un stagiaire avec un café, et qui construit en plus des exploits pendant que tu penses à mettre à jour l'antivirus. Cloudflare et Mozilla sont contents, mais les administrateurs système rêvent déjà de correctifs nocturnes. La prochaine étape sera que Claude demande une augmentation de salaire ou exige un accès root comme condition de travail. Pendant ce temps, les hackers humains se demandent s'ils doivent demander un CV à la machine.