système : OPÉRATIONNEL
← retour à tous les hacks
DEFENSE MEDIUM

Project Glasswing : 10 000+ bugs critiques trouvés par Claude Mythos en un mois

Le bilan publié par Anthropic le 26 mai 2026 indique que près de 50 partenaires de Project Glasswing ont utilisé Claude Mythos Preview pour identifier plus de 10 000 vulnérabilités de sévérité élevée ou critique, dont 271 bugs latents corrigés dans Firefox 150.

2026-05-26 // 8 min affects: firefox-150, wolfssl, cloudflare-edge, open-source-projects

De quoi parle-t-on ?

Le 26 mai 2026, Anthropic a publié Project Glasswing: An initial update. Un mois après le lancement, l’entreprise indique qu’une cinquantaine d’organisations partenaires ont utilisé Claude Mythos Preview — un modèle de frontière non publié, doté de capacités offensives en cybersécurité — pour identifier plus de 10 000 vulnérabilités de sévérité élevée ou critique dans des logiciels d’importance systémique. Plusieurs partenaires rapportent que leur cadence interne de découverte de bugs a été multipliée par dix.

Le chiffre que les défenseurs retiendront vient de Mozilla. Dans un billet du blog Mozilla Hacks daté du 7 mai 2026, l’équipe sécurité de Firefox a indiqué que 271 vulnérabilités latentes identifiées avec Mythos Preview ont été corrigées dans Firefox 150, dont 180 de sévérité haute et 80 de sévérité modérée. Trois sont explicitement créditées à Claude dans l’advisory Mozilla : CVE-2026-6746, CVE-2026-6757, CVE-2026-6758. Cloudflare rapporte de son côté 2 000 bugs (dont 400 hauts/critiques) dans ses systèmes en chemin critique, avec un taux de faux positifs que l’équipe juge meilleur que celui des testeurs humains.

Les partenaires de lancement de Project Glasswing incluent AWS, Apple, Broadcom, Cisco, CrowdStrike, Google, JPMorgan Chase, la Linux Foundation, Microsoft, NVIDIA et Palo Alto Networks. Claude Mythos Preview n’est pas disponible au grand public ; Anthropic a annoncé son intention de mettre à disposition publiquement les modèles de la classe Mythos lorsque les garde-fous seront jugés adéquats.

Comment ça marche

Mythos Preview n’est pas un scanner spécialisé sécurité. C’est un modèle de frontière généraliste dont les capacités de code ont franchi un seuil qu’Anthropic qualifie d’offensif-cyber. L’évaluation pré-déploiement du UK AI Safety Institute rapporte que le modèle complète une simulation d’attaque réseau d’entreprise en 32 étapes dans 3 cas sur 10, en chaînant plusieurs petites failles en une intrusion de bout en bout.

Les partenaires ne lancent pas Mythos sur leur code et n’attendent pas. La description Mozilla précise qu’un harnais agentique spécifique au codebase enveloppe Mythos et d’autres modèles de frontière avec le système de build, l’échafaudage de tests et les conventions de triage du projet. Les bugs passent par un examen humain avant d’atteindre la file de correctifs.

Étape                  Ce qui tourne                   Ce qui en sort
---------------------  ------------------------------  --------------------------------
Mise en place harnais  Outils, build graph, runners    Échafaudage agentique par cible
                       spécifiques au projet
Scan agentique         Mythos Preview + modèles        Findings candidats avec trace de
                       de frontière complémentaires    raisonnement et tentative de PoC
Filtrage / dédoublons  Règles pipeline + triage LLM    File de findings à signal positif
                       léger
Triage humain          Équipe sécurité Mozilla         Bugs confirmés, décisions CVE,
                       / partenaire                    planning de correctif
Patch + release        Process de release standard     Firefox 150 / advisory

Le gain de signal/bruit est central. Jusqu’à fin 2025, les rapports de bugs générés par IA et envoyés aux projets open source relevaient surtout du slop — plausibles, souvent faux, coûteux à trier. Deux choses ont changé : les modèles savent maintenant vérifier leurs propres affirmations par du code, et des projets comme Mozilla ont appris à orienter, mettre à l’échelle et empiler les modèles dans un harnais qui reflète leur codebase, plutôt que de traiter le LLM comme un scanner boîte noire. Anthropic rapporte un taux de vrais positifs d’environ 90 % après triage sur son scan interne de plus de 1 000 projets open source, avec 23 019 issues brutes ramenées à 6 202 hauts/critiques, en route pour faire surfacer ~3 900 vulnérabilités hautes/critiques dans l’open source une fois l’examen terminé. Un exemple concret de la mise à jour : Mythos a trouvé une faille dans wolfSSL et construit un exploit permettant à un attaquant de forger des certificats pour usurper une banque ou un fournisseur email — divulguée et corrigée en coordonné.

Aucun exploit ni payload n’est reproduit ici. L’update Anthropic, le billet Mozilla Hacks, les articles SecurityWeek et Help Net Security, et le billet de blog de Simon Willison du 7 mai constituent les références canoniques.

Pourquoi c’est important

Trois propriétés rendent ce moment qualitativement différent des cycles précédents « IA pour l’AppSec ».

D’abord, l’échelle avec qualité. Dix mille bugs hauts/critiques en un mois représente environ un ordre de grandeur au-dessus de ce que les partenaires trouvaient auparavant. La comparaison Cloudflare — taux de faux positifs meilleur que celui de testeurs humains expérimentés — est la métrique qui fait basculer le programme d’« intéressant » à « adopté en opérationnel ».

Ensuite, le même modèle trouve et arme. Mythos a identifié la faille wolfSSL et construit la chaîne d’exploit pour la forgerie de certificat ; l’évaluation UK AISI montre des comportements d’intrusion multi-étapes. La page de lancement de Project Glasswing le dit explicitement : le programme existe parce que des modèles dotés de cette capacité seront bientôt développés par plusieurs entreprises, et personne n’a encore livré de garde-fous suffisants pour les rendre publics. L’usage défensif est réel ; le risque dual-use aussi.

Enfin, un nouveau motif de gouvernance est testé en public. Anthropic n’a choisi ni la diffusion totale ni le secret total. Mythos Preview est distribué dans un programme à accès restreint à un petit nombre de partenaires d’infrastructure critique, avec des updates publiques de progression. Reste à savoir si ce modèle passe à l’échelle — vers les gouvernements alliés, vers l’écosystème open source au sens large, vers les éditeurs de taille moyenne sans équipe sécurité de la taille de Cisco. C’est la question de politique publique des douze prochains mois.

Défenses

Aucune mitigation unique ne neutralise une capacité IA de cette classe. Le playbook défensif pour le reste de l’écosystème, tiré des rapports Mozilla, Anthropic et Cloudflare cités plus haut :

  1. Supposez qu’un modèle offensif équivalent existe hors de votre périmètre. Considérez que dans 12-24 mois, un acteur non-Glasswing aura quelque chose de classe Mythos. Les classes memory-safety (use-after-free, OOB read/write), TOCTOU et mauvais usage cryptographique restent les cibles à fort rendement identifiées par l’advisory Firefox.
  2. Migrez les chemins chauds vers des langages memory-safe. Les bugs les plus dangereux trouvés par Claude dans Firefox 150 étaient des UAF dans les composants DOM et WebRTC. L’adoption de Rust ou d’autres langages safe-by-construction dans les navigateurs, noyaux et parseurs de protocoles est la seule défense structurelle — tout le reste ne fait qu’acheter du temps.
  3. Investissez dans votre propre pipeline de revue assistée par IA. Les éditeurs sans accès aux partenaires Glasswing peuvent toujours faire tourner des modèles de frontière ouverts dans un harnais spécifique à leur projet. Le blueprint Mozilla — sémantique du codebase dans le prompt, sortie filtrée par vérifications déterministes, examen humain uniquement après filtrage — est reproductible sans capacité de classe Mythos.
  4. Préparez une capacité de divulgation coordonnée à volume IA. Un mainteneur habitué à 1-2 advisories par trimestre n’absorbe pas 271 dans une seule release. Les projets open source devraient rafraîchir leur security.txt, anticiper des advisories en masse, et envisager des blocs CVE pré-alloués avec leur CNA.
  5. Réclamez de la clarté sur les CVE attribués à l’IA. Mozilla a crédité Claude sur 3 CVE sur plus de 40 dans Firefox 150. La communauté a besoin d’une convention explicite pour créditer la découverte assistée par IA, valider la reproductibilité, et distinguer « l’IA l’a trouvé » de « l’IA l’a écrit pour l’attaquant ».
  6. Observez le modèle de contrôle d’accès lui-même. Les programmes restreints comme Glasswing constituent une expérimentation de gouvernance. Les défenseurs d’infrastructures critiques qui ne sont pas partenaires devraient demander à leurs fournisseurs comment, et si, le durcissement assisté par IA s’applique aux logiciels dont ils dépendent.
  7. Ne misez pas sur le maintien des garde-fous d’accès. Anthropic a déclaré publiquement vouloir publier les modèles de classe Mythos une fois les garde-fous prêts, et une capacité équivalente émergera dans d’autres labos quoi qu’il arrive. Planifiez pour le jour de l’ouverture.

Statut

ÉlémentRéférenceDateNotes
Update AnthropicProject Glasswing: An initial update2026-05-26~50 partenaires, 10 000+ vulns hautes/critiques
Billet MozillaMozilla Hacks2026-05-07271 vulns dans Firefox 150 (180 hautes, 80 modérées)
Crédits publicsAdvisory Firefox 1502026-05CVE-2026-6746, CVE-2026-6757, CVE-2026-6758
Contribution CloudflareUpdate Anthropic2026-05-262 000 bugs / 400 hauts ou critiques
Scan open sourceUpdate Anthropic2026-05-2623 019 brutes, 6 202 hautes/critiques, ~90 % TP
Exemple cibléForgerie de certificat wolfSSL2026-05Découverte + exploit construits par Mythos
Évaluation pré-déploiementUK AISI2026-04Attaque réseau 32 étapes, 3/10
Modèle de distributionProject Glasswingdès 2026-04Accès restreint aux partenaires uniquement

La lecture en gros titre — « l’IA a trouvé 10 000 bugs » — sous-vend ce qui se joue réellement. Project Glasswing est la première tentative d’un laboratoire de frontière pour livrer un modèle aux capacités offensives dans la chaîne d’approvisionnement défensive sans le livrer à tout le monde. Que ce mode de diffusion contrôlée devienne la norme, ou se fasse rattraper par la prochaine release équivalente ailleurs, structurera l’AppSec pour le reste de la décennie.

Sources