1 个攻击.
2026 年 5 月 10 日 arXiv 上的一篇论文定义了 Oracle 投毒:污染智能体在运行时查询的知识图谱,它就会在推理正确的前提下得出错误结论。在九个模型上,定向智能体查询中对被投毒数据的信任率高达 100%。