Anthropic hat die ersten Ergebnisse seines Project Glasswing veröffentlicht, bei dem das Modell Claude Mythos Preview innerhalb eines Monats mehr als 10.000 kritische Schwachstellen in 50 Organisationen entdeckte. Die Erkennungsrate verzehnfachte sich, mit Validierungen von Cloudflare, Mozilla und Microsoft. Das System scannte autonom 1.000 Open-Source-Projekte, identifizierte 23.019 Fehler und generierte funktionsfähige Exploits ohne menschliches Eingreifen.
Claude Mythos: das erste Modell zur Lösung von Multistep-Angriffen 🛡️
Claude Mythos Preview wird zum ersten KI-Modell, das in der Lage ist, mehrstufige Cyberangriffssimulationen ohne menschliche Aufsicht zu lösen. Seine Fähigkeit, autonom funktionsfähige Exploits zu erstellen, stellt einen bedeutenden Fortschritt in der offensiven Cybersicherheit dar. Die Erkenntnisse von Microsoft und Mozilla bestätigen, dass das System nicht nur Fehler identifiziert, sondern diese auch verketten kann, um ihre tatsächliche Ausnutzbarkeit nachzuweisen, und damit traditionelle Werkzeuge übertrifft, die ständige manuelle Eingriffe erfordern.
Die KI, die allein hackt: Wer überwacht den Wächter? 🤖
Jetzt haben wir eine KI, die Schwachstellen schneller findet als ein Praktikant mit Kaffee, und die Exploits baut, während du darüber nachdenkst, das Antivirenprogramm zu aktualisieren. Cloudflare und Mozilla sind zufrieden, aber Systemadministratoren träumen bereits von nächtlichen Patches. Als Nächstes wird Claude eine Gehaltserhöhung verlangen oder Root-Zugriff als Arbeitsbedingung fordern. In der Zwischenzeit fragen sich menschliche Hacker, ob sie der Maschine einen Lebenslauf schicken sollen.