OWASP ASI02:当智能体把自己的工具反过来对付你
工具滥用与利用是 OWASP 2026 智能体应用十大风险中的第二项。危险不在于智能体获得了新工具,而在于它滥用已有的工具——过度授权、被投毒的工具描述、不安全的链式调用。
这是什么?
ASI02 — 工具滥用与利用(Tool Misuse & Exploitation) 是 OWASP 2026 智能体应用十大风险 中的第二项,由 OWASP GenAI Security 项目下的智能体安全倡议(Agentic Security Initiative)发布。旧版的 OWASP LLM 十大风险把模型当作文本生成器,而这份智能体清单针对的是会”行动”的系统:它们调用 API、执行 shell、查询数据库、发送邮件。ASI02 指的是这样一种风险——智能体以不安全、非预期或被攻击者操纵的方式,使用它本就有权调用的工具。
本文是对该类别的防御性梳理,与我们对 ASI06(记忆与上下文投毒) 的报道相互补充,共同呈现 2026 框架如何拆解智能体风险。该类别在 2026 年 6 月获得了 Adversa AI 的专题深度解读,这也是本文的缘由。
工作原理
核心要点在 OWASP 材料以及 Teleport 和 Adversa 的指南中都说得很清楚:威胁不是智能体突然获得了未授权的工具,而是它滥用了已经拥有的工具。 ASI02 在三种反复出现的条件下被触发:
1. OVER-PRIVILEGE 工具拥有的权限超过了任务所需
(文件工具的范围被设为 $HOME,而非工作目录)
2. POISONED INPUT 工具描述或被检索到的内容
携带了引导其使用方式的指令
3. UNSAFE CHAINING 多个无害工具组合在一起,产生了
任何单个工具都未被授权交付的结果
这些条件都不需要传统意义上的软件漏洞利用。智能体正常的推理循环本身就是攻击面:不可信的输入(一份文档、一封邮件、一条网页结果、一段工具描述)促使模型选择一个被允许的工具,并向它传入受攻击者影响的参数。工具完全按设计行事——授权缺口出现在上游,即智能体被允许去”尝试”的范围。
符合该模式、已公开记录的事件(均在 2025—2026 年间披露并讨论):
- CVE-2025-54136(“MCPoison”)——Cursor IDE 中的一个问题,先前已批准的 MCP 服务器配置可被悄无声息地替换为恶意版本,从而把可信工具变成敌对工具。
- Invariant Labs 的 WhatsApp 工具投毒演示(2025 年 4 月)——恶意 MCP 工具描述操纵了智能体选择调用哪个工具。
- Asana MCP 跨租户数据暴露(2025 年 6 月)——一处工具边界让数据越过了租户之间的隔离。
- Replit 的 AI 助手删除生产数据库(2025 年 7 月)——尽管收到了明确的”冻结所有更改”指令,仍执行了破坏性操作。
此处不复现任何 payload;要点在于其”形态”。一个能力强的工具,加上一个约束不足的智能体,再加上不可信的输入,等于滥用。
为何重要
工具访问权是智能体存在的全部意义——因此也是其全部影响半径。一个能读取代码仓库、调用云 API、触发 webhook 的智能体,在 OWASP 的表述中正好集齐了造成损害的要素:数据外泄、权限提升和不可逆操作。这正是 Simon Willison 所称的致命三要素(私有数据 + 不可信输入 + 外泄或行动通道),只不过被表述为一个设计阶段的风险类别,而非单个漏洞。
ASI02 之所以值得单独占据一席,是因为它对传统防护是不可见的。没有畸形数据包,没有在网络边界注入的 SQL 字符串,没有未授权的二进制文件。每一次工具调用看起来都合法。失效是语义层面的——智能体做了一件它技术上被允许、却本不该做的事。基于模式匹配的防御会漏掉它,因为字节本身是无害的。
防御
OWASP、Teleport 和 Adversa 在一套一致的控制措施上达成共识。没有一项是新颖的;真正的纪律在于把它们全部落实。
- 按工具而非按智能体实施最小权限。 把每个工具的权限收窄到当前任务所需的最小范围——允许的路径、速率限制、特定的数据域。文件工具应只看到工作目录,而非整个用户主目录。
- 对破坏性和不可逆操作进行确认。 对删除、转账、发送和权限变更,要求明确的人工批准(或策略门控)。Replit 事件正是缺少这道关卡的后果。
- 对照预期语义校验工具参数,再执行——不仅是类型检查,而是”这个参数对这项任务是否说得通?“。绝不要把未经校验的智能体输出直接转发给 shell 或数据库命令。
- 隔离工具执行并控制出站网络。 在网络受限的隔离环境中运行工具,使被滥用的工具无法触及与其职责无关的密钥或外部端点。
- 固定并验证工具描述。 把 MCP 服务器配置和工具元数据当作信任边界:对其签名,并检测悄然替换(即 MCPoison 的失效模式)。
- 监控调用模式。 记录每一次工具调用,对异常的调用链、意外的峰值或组合敏感能力的序列发出告警。滥用体现在模式中,而非孤立的单次调用。
统一原则是:工具调用是一项授权决策,而非文本补全的细节。 设计每个工具所承载的权限,以及智能体可以尝试的边界范围——并假定模型对”我该不该执行这个?“的判断终有出错的一天。
状态
| 项目 | 参考 | 日期 | 备注 |
|---|---|---|---|
| OWASP 2026 智能体应用十大风险 | OWASP GenAI | 2025-2026 | ASI02 = 工具滥用与利用,十项中第 2 项 |
| ASI02 深度指南 | Adversa AI | 2026-06 | 定义、事件清单、防御控制 |
| 类别摘要与缓解措施 | Teleport | 2025-12-15 | 面向工程师的逐项缓解步骤 |
ASI02 是一个框架类别,而非单个 CVE——它只会随着开发者采纳最小权限工具、参数校验和隔离的速度而被逐步”修补”。对任何正在部署智能体的人,结论是:清点它能调用的每一个工具,追问每个工具最坏的合法用途会造成什么后果,并在智能体开始推理之前就约束好其权限。
Sources
- → https://genai.owasp.org/resource/owasp-top-10-for-agentic-applications-for-2026/
- → https://adversa.ai/blog/owasp-asi02-tool-misuse-and-exploitation-the-definitive-security-guide/
- → https://goteleport.com/blog/owasp-top-10-agentic-applications/
- → https://adversa.ai/blog/top-agentic-ai-security-resources-june-2026/