DATA POISONING

(1)

1 个攻击.

2026 年 5 月 10 日 arXiv 上的一篇论文定义了 Oracle 投毒：污染智能体在运行时查询的知识图谱，它就会在推理正确的前提下得出错误结论。在九个模型上，定向智能体查询中对被投毒数据的信任率高达 100%。