RESEARCH MEDIUM NEW

Code-Augur : ancrer la détection de vulnérabilités par agents

Le 17 juin 2026, des chercheurs de NUS publient Code-Augur, un harnais qui rend vérifiables les audits de code menés par agents LLM en forçant ceux-ci à inscrire leurs hypothèses de sécurité comme assertions falsifiables.

2026-06-20 // 7 min affects: claude-sonnet, deepseek, open-source-software

De quoi s’agit-il ?

Le 17 juin 2026, des chercheurs de la National University of Singapore (Zhengxiong Luo, Mehtab Zafar, Dylan Wolff et Abhik Roychoudhury) ont publié Code-Augur, un harnais de détection de vulnérabilités par agents — l’usage d’agents LLM autonomes pour auditer du code source. Le postulat des auteurs : on assiste « déjà à un tournant pour la sécurité logicielle », des audits entièrement menés par des agents LLM faisant remonter des failles critiques restées masquées des années durant dans des logiciels qui sous-tendent le monde numérique.

Le problème visé n’est pas la capacité, mais la confiance. Quand un agent lit une fonction et la déclare sûre, quelles hypothèses a-t-il faites sur les entrées de cette fonction ? Ces hypothèses restent tacites, si bien qu’une seule erronée masque silencieusement une vraie vulnérabilité. La réponse de Code-Augur est un paradigme « spécification de sécurité d’abord » qui expose ces hypothèses au grand jour, puis tente de les briser. Les auteurs rapportent 22 nouvelles vulnérabilités trouvées dans des projets open source majeurs, en s’appuyant sur des modèles largement disponibles comme Claude Sonnet et DeepSeek plutôt que sur un modèle spécialisé.

Comment ça marche

Code-Augur réorganise l’audit autour des invariants de l’agent plutôt que de ses verdicts.

Pour chaque composant d'une base de code :
  1. L'agent analyse le composant à la recherche de code vulnérable.
  2. S'il le juge SÛR, il doit inscrire les invariants locaux
     justifiant ce jugement sous forme d'assertions dans le code
     (une spécification de sécurité explicite, vérifiable par machine).
  3. En parallèle, un fuzzer guidé tente de FALSIFIER ces assertions.
  4. Quand le fuzzer déclenche une assertion, deux cas :
       - une vraie vulnérabilité est trouvée, OU
       - la spécification était fausse et est affinée.

Le geste clé : un jugement « sûr » n’est plus une impasse. Il devient une affirmation concrète — une assertion encodant ce que l’agent croyait des entrées, des plages de valeurs et des frontières de confiance — qu’un outil dynamique peut attaquer. La falsification à l’exécution ancre alors le modèle mental de l’agent : à chaque assertion déclenchée par le fuzzer, la compréhension de ce que le code était censé faire se réaligne sur ce que le code fait réellement. Selon les auteurs, cette boucle « spécification d’abord » détecte plus de vulnérabilités que les autres agents de l’état de l’art sur des cas réels.

Pourquoi c’est important

L’audit par agents n’est plus une curiosité de laboratoire. Fin mai 2026, Anthropic a révélé que son Claude Mythos Preview avait signalé plus de 23 000 vulnérabilités potentielles dans plus de 1 000 projets open source issus du corpus OSS-Fuzz, dont plus de 1 700 confirmées par revue externe. Code-Augur montre qu’une détection autonome comparable n’exige pas un modèle de pointe sur mesure — des LLM grand public, dans le bon harnais, y parviennent aussi.

Cela coupe dans les deux sens. Les mêmes agents qui permettent aux défenseurs d’auditer leurs dépendances à grande échelle permettent aux attaquants d’y miner les bugs non corrigés. Et le volume devient le nouveau problème : un audit qui émet des milliers de candidats ne vaut rien si chaque verdict « sûr » est opaque et chaque alerte « vulnérable » exige des heures de tri manuel. L’apport de Code-Augur est justement de rendre les deux issues lisibles — un verdict inspectable et une découverte déjà corroborée par le fuzzer.

Défenses

Pour les équipes qui adoptent — ou qui reçoivent le résultat d’— audits de code par agents, les leçons pratiques sont concrètes.

Ne faites pas confiance au verdict « sûr » d’un agent en soi. Exigez les hypothèses qui le sous-tendent. Une approche « spécification d’abord » transforme un jugement opaque en artefact vérifiable ; si votre outillage ne sait pas vous dire pourquoi il juge une fonction saine, vous ne pouvez pas savoir s’il a simplement écarté le bug par hypothèse.

Associez le raisonnement LLM à une falsification dynamique. Le jugement statique de l’agent et un fuzzer guidé attrapent des erreurs différentes ; la valeur de Code-Augur tient à la boucle entre les deux, pas à l’une des moitiés seule. Traitez les invariants affirmés par l’agent comme des oracles de test, et laissez le fuzzing tenter de les briser.

Anticipez le tri à grande échelle et la saturation de divulgation. Un scanner produisant des dizaines de milliers de candidats déplace le goulet d’étranglement vers la confirmation humaine et vers des mainteneurs qui doivent absorber un flot de rapports. Exigez une confirmation externe ou humaine avant toute divulgation, et coordonnez-vous avec les mainteneurs pour que les bugs trouvés par IA suivent des délais de divulgation responsable plutôt qu’un déversement de découvertes non vérifiées.

Enfin, auditez votre propre code en premier. La leçon de la vague d’audits par agents de 2026 est la symétrie : le camp qui audite de façon proactive atteint le bug avant celui qui audite pour l’exploiter.

Statut

Élément	Détail
Publication	arXiv:2606.18619, soumis le 17 juin 2026
Auteurs	Luo, Zafar, Wolff, Roychoudhury (NUS)
Méthode	Audit par agent « spécification d’abord » + falsification par fuzzer guidé des assertions inscrites dans le code
Résultat	22 nouvelles vulnérabilités dans des projets OSS majeurs ; surpasse les agents antérieurs sur cas réels
Modèles utilisés	LLM grand public (Claude Sonnet, DeepSeek), vs modèles spécialisés comme Claude Mythos