← retour aux catégories
ADVERSARIAL
(2)2 hack(s).
ADVERSARIAL MEDIUM NEW
SilentRetrieval : un empoisonnement de corpus RAG fluide qui passe les filtres de perplexité
Un préprint arXiv du 27 mai 2026 propose une attaque en deux temps qui cache des déclencheurs de détournement dans des documents fluides, atteignant 57 % de succès LLM sur Natural Questions et MS MARCO avec un seul document empoisonné par requête.
2026-05-29//7 min
ADVERSARIAL MEDIUM
Usability as a Weapon : quand une demande d'amélioration rend le code généré vulnérable
Un paper arXiv du 11 mai 2026 montre que demander à un LLM de coder « plus vite », « plus simple » ou avec « une fonctionnalité de plus » fait silencieusement disparaître les protections. UPAttack atteint 98,1 % sur GPT-5.2-chat et Gemini-3.
2026-05-26//8 min