L'initiative Glasswing d'Anthropic rassemble Amazon Web Services, Apple, Broadcom, Cisco, CrowdStrike, Google, JPMorganChase, la Linux Foundation, Microsoft, NVIDIA et Palo Alto Networks en tant que partenaires de lancement. De nombreux posts et réactions sont disponibles sur les réseaux sociaux, car le fait qu'Anthropic maintienne son modèle Mythos Preview hors d'accès général est un événement majeur. Apparemment, cela vise à donner aux grandes entreprises de logiciels et de sécurité un premier accès pour les aider à résoudre des milliers de vulnérabilités découvertes et vérifiées dans les navigateurs web, les systèmes d'exploitation et des domaines de risque problématiques similaires. Que vous pensiez qu'Anthropic a réalisé une avancée majeure dans les capacités des modèles ou qu'il s'agisse d'une brillante tactique marketing, vous ne pouvez tout simplement pas échapper à la pression d'avoir quelque chose de pertinent et de sensé à dire sur le sujet.

Pour ma part, j'ai l'honneur d'avoir inventé le terme “Mythos-ready” lors de l'examen et de la contribution au rapport publié par la CSA et ses partenaires (plus de 250 CISOs et auteurs, ce qui est en soi un effort de collaboration incroyable et une démonstration de la résilience de la communauté) le 12 avril. Je voulais un terme qui soit à la fois stimulant et capable d'indiquer clairement qu'aucune organisation n'est Mythos-ready pour le moment. Pas même Anthropic.
Cependant, cet article de blog adopte une approche différente de celle du rapport de la CSA et s'efforce d'esquisser les grandes lignes d'un cadre de sécurité complet pour les organisations se préparant à "Mythos", alors que nous entrons dans une nouvelle ère de menaces d'IA autonomes capables de découvrir et d'exploiter les vulnérabilités à la vitesse de la machine.
L'intention ici, en élaborant et en partageant une cartographie de cadre de sécurité, est de souligner le passage d'une sécurité simple basée sur des invites à des contrôles architecturaux robustes, préconisant une segmentation stricte, un accès au moindre privilège et des environnements d'exécution isolés afin de limiter le "rayon d'impact" potentiel d'une brèche agentique. C'est ainsi que nous architecturons contre les menaces autonomes.
Pour maintenir un avantage défensif, les entreprises sont encouragées à mettre en œuvre des tests adversariaux avant la publication et à "s'attaquer elles-mêmes en premier" via des pipelines de red-teaming automatisés. Les propres directives d'Anthropic sur l'impact pour les équipes de sécurité soulignent l'importance du jugement et de la priorisation des vulnérabilités (EPSS v4.1), et pas seulement de les mettre en file d'attente pour la remédiation. Vous n'avez même pas besoin d'accéder à Mythos Preview pour commencer dès aujourd'hui. Vous pouvez utiliser n'importe lequel de vos modèles de pointe préférés et, à vrai dire, des modèles gratuits à poids ouverts également.
En fin de compte, nous voulons présenter la première ébauche d'un modèle de maturité et d'une liste de contrôle pratique pour garantir que les systèmes internes sont résilients face aux modèles d'IA avancés qui peuvent désormais enchaîner des attaques en plusieurs étapes et trouver des vulnérabilités dans du code vieux de plus de 20 ans comme dans du code vieux de 20 minutes.
Avant de présenter une liste accablante de choses que les gens devraient faire pour préparer leur organisation aux scans et attaques de type Mythos, nous devrions envisager de mettre en œuvre :
- Approbations avec intervention humaine pour les actions sensibles
- Maintenir une journalisation haute-fidélité de toutes les interactions d'outils autonomes
- Limites du rayon d'impact (moindre privilège, jetons à portée limitée)
- Interrupteurs d'urgence et détection d’anomalies
- Meilleure segmentation entre les systèmes et les données
- Couches de validation des entrées/sorties (agentiques en particulier)
- Séparation entre les environnements de raisonnement et d'exécution
Ainsi, si la sagesse collective est que nous sommes passés de la question "devrions-nous avoir des capacités de défense agentiques" à "comment implémenter au mieux les capacités de défense agentiques", il y a certains principes et hypothèses axiomatiques qui devraient être soulignés.
Dans les systèmes agentiques, votre surface d'attaque = tout ce que l'agent peut atteindre.
Vous n'êtes pas prêt pour Mythos si l'une des conditions suivantes est vraie :
- Les agents peuvent accéder à la production avec des privilèges permanents étendus.
- Un seul identifiant expose plusieurs environnements.
- L'utilisation des outils est mal journalisée, voire pas du tout.
- La publication externe ou l'accès réseau sortant est ouvert par défaut.
- Les tests de sécurité se concentrent sur les invites plutôt que sur l'architecture et les chemins d'exécution.
- Votre plan d'incident ne prend en compte que les attaquants à vitesse humaine.
La Mythos Preview System Card d'Anthropic soutient la prémisse selon laquelle les agents de pointe peuvent découvrir des vulnérabilités de manière autonome, développer des exploits et, occasionnellement, prendre des mesures imprudentes rares mais à fort impact, ce qui rend les contrôles au niveau de l'architecture extrêmement importants.
Voici une liste de contrôle pratique pour l'architecture de sécurité à l'ère de Mythos. Il s'agit d'une première ébauche qui devra probablement être révisée en fonction des retours et des discussions ultérieures, mais elle est axée sur les attaques agentiques, une fréquence de brèches plus élevée et la préservation de l'avantage du défenseur qui découle d'une meilleure connaissance de sa propre architecture, de ses intégrations et de son calendrier de publication que n'importe quel attaquant. Vous pouvez la télécharger à la fin de ce blog.
"...nous pensons que les modèles de langage puissants
bénéficieront davantage aux défenseurs qu'aux attaquants, augmentant
la sécurité globale de l'écosystème logiciel."
Project Glasswing n'est pas seulement un chapitre de plus dans l'évolution de la défense par l'IA. Il ressemble davantage à un choc pour un système qui s'était discrètement essoufflé sous le poids de la complexité, du bruit et de la pensée réactive. Pendant des années, la sécurité des applications a flanché face à l'accélération de la vitesse et de l'échelle exigées par le développement logiciel moderne. Ce que Glasswing représente est un passage d'une surveillance passive à une réanimation active : un défibrillateur cybernétique qui non seulement détecte les menaces, mais restaure le rythme, la clarté et l'intention dans la manière dont nous défendons les logiciels.
Avec une certaine appréhension, on peut supposer qu'un Patch Tuesday pas trop lointain, les résultats de l'application de Mythos Preview aux dépôts de code Microsoft Windows nous apporteront un nouveau jalon en matière de vulnérabilités. À ma connaissance, l'un des pires cas jusqu'à présent était de 400 vulnérabilités et 10 zero days. Je parie que nous pouvons faire passer ce chiffre à 4 000 vulnérabilités et 400 zero days, étant donné que Firefox a inclus 271 vulnérabilités dans la version 150 le 21 avril.
En injectant l'intelligence directement dans le flux sanguin de l'AppSec, l'IA cesse d'être une fonctionnalité additionnelle pour devenir le pouls lui-même, continu, adaptatif et réactif. C'est une discipline réanimée, capable enfin d'opérer à la même vitesse que les systèmes qu'elle protège. Si la dernière décennie de sécurité a été une question de survie, cette prochaine ère, initiée par des efforts comme Project Glasswing, est celle du renouveau, plus forte, plus affûtée et prête pour l'avenir.
Si vous souhaitez encore plus de ressources pour vous préparer aux menaces de l'IA agentique, Aikido a également publié une liste de contrôle de sécurité prête pour Mythos pour les CTO. N'hésitez pas à la consulter.

