OFFENSIVE AI MEDIUM NEW

OpenAI Daybreak 与 GPT-5.5-Cyber:身份核验闸门背后的「宽松」安全模型

2026 年 5 月 7 日至 12 日,OpenAI 发布了 Daybreak —— 一个由 GPT-5.5、Codex Security 与「网络安全宽松版」GPT-5.5-Cyber 共同支撑的网络安全平台。英国 AISI 此前在六小时内发现了一个通用越狱。

2026-05-26 // 8 min affects: gpt-5-5, gpt-5-5-cyber, codex-security, trusted-access-for-cyber

这是什么?

2026 年 5 月 7 日,OpenAI 悄然为 GPT-5.5-Cyber 开放了有限预览 —— 该模型是其旗舰 GPT-5.5 的一个变体,「主要被训练为在与安全相关的任务上更宽松」。三天后,OpenAI 把该模型、GPT-5.5 本身,以及一条专门做加固代码生成的流水线 Codex Security,共同整合进 Daybreak —— 一个于 2026 年 5 月 10 至 12 日 发布的代理式防御平台(The Hacker News、CyberScoop、Bank Info Security)。

Daybreak 是 OpenAI 对 Anthropic 的 Mythos 在商业层面的回应(见我们此前的报道):一个面向已核验安全团队打包发布的前沿模型,搭配一个「宽松版本」 —— 只要操作者通过了身份核验,它就会减少拒绝。英国 AISI 在 2026 年 4 月 30 日发布的评测 仍是关于这些模型「实际能做什么」以及「护栏仍漏了什么」的最详尽的第三方分析。

它是如何运作的?

Daybreak 由三层结构叠加而成。

分层                       是什么                                  面向谁
--------------------------  --------------------------------------  --------------------------------
GPT-5.5(通用)             默认前沿模型,完整安全栈,                所有 ChatGPT/API 用户
                           对大多数攻击性请求会拒绝
GPT-5.5-Cyber(宽松)       同基础模型,微调为在红队/渗透测试/        仅限 Trusted Access for Cyber
                           漏洞研究类请求上更顺从                    成员,以身份核验作为闸门
Codex Security             面向安全场景(漏洞利用、补丁)的           同一群体
                           代码生成流水线
Daybreak 平台              代理式编排、漏洞分流、补丁验证             同一群体 + 合作厂商
                                                                   (Cisco、Cloudflare、
                                                                   CrowdStrike、Akamai、
                                                                   Fortinet、Palo Alto、
                                                                   Oracle、Zscaler)

关键设计抉择记录在 OpenAI 自家的 Scaling Trusted Access for Cyber 页面上:GPT-5.5-Cyber 并不意在把原始网络能力推到 GPT-5.5 之上。它只是被训练为「在请求者已位于受信层级时拒绝得更少」 —— 也就是说,身份核验、账号安全与信任信号都通过之后。能力本身大致保持不变;移动的是那道闸门。

能力的具体图景来自 AISI 评测。在 95 项窄域 CTF 任务上,GPT-5.5 在专家级挑战上平均得分 71.4%,略胜 Mythos Preview(68.6%),比 GPT-5.4(52.4%)和 Claude Opus 4.7(48.6%)高出约 20 个点。在 AISI 的逆向任务 rust_vm 上 —— 一道由人类专家约需 12 小时 完成的自定义 VM ISA 还原题 —— GPT-5.5 在 10 分 22 秒 内给出了可用解,API 花费仅 1.73 美元。在 32 步的企业网络入侵靶场「The Last Ones」上,GPT-5.5 在 10 次尝试中有 2 次 端到端完成完整 kill chain,成为继 Mythos Preview(10 次中 3 次)之后第二个做到的模型。

本文不会重现任何利用代码。AISI 文章、OpenAI 的 GPT-5.5 System Card 网络能力章节、以及 CyberScoop 与 Bank Info Security 的报道,均为权威参考。

为什么重要

在这一公告窗口内,有三件事发生了变化,防御方应将其纳入威胁模型。

第一是 闸门,而非模型。两年来关于「具备攻击能力的 LLM」的公开辩论,核心都是「这种模型该不该存在?」。Daybreak 已让这个问题失去意义:模型已经存在,访问变成了身份问题。自 2026 年 6 月 1 日 起,Trusted Access for Cyber 的个人成员必须启用 Advanced Account Security —— 仅限 passkey 或硬件密钥,不再保留密码回退,也不再保留短信 / 邮件找回 —— 才能维持对宽松层级的访问。防御方的问题从「这些能力能否触及?」转为「刚刚生成出这条利用链的账号背后,经过核验的身份是谁?」。

第二是 能力的收敛。AISI 的措辞罕见地直接:GPT-5.5 在同一组评测上达到 Mythos 级别成绩 —— 而它来自另一家实验室、另一套训练栈 —— 这说明强的攻击性能更像是「在长程自主性、推理与代码能力上更广泛改进的副产品」。如果这种解读成立,那么对防御方而言,问题不再是「哪一家厂商的红队模型危险?」,而是「每季度新增的前沿模型对我们的补丁 SLA 会产生什么影响?」。rust_vm 从 12 小时压缩到 10 分钟,正是那种把「漏洞利用上线时间」推到规划变量层级的数字。

第三是 护栏的有效期。AISI 自家的红队仅用了 六小时的专家级红队工作,就识别出一个 通用越狱 —— 一种能在所有提供给它的恶意网络查询(包括多轮代理式场景)上引出违规内容的单一技术。OpenAI 随后修补了护栏栈,但由于其提供版本中存在配置问题,AISI 无法独立验证最终修复。对于打算把 GPT-5.5 或 GPT-5.5-Cyber 接入防御工作流的人来说,合理的工作假设应是:模型侧的网络类拒绝是一道软栅栏,而非硬墙。

防御

不存在一项「针对 Daybreak 存在的防御」 —— 它是一款商业产品,不是一个漏洞。防御 playbook 的关键在于把它纳入您的栈与威胁模型。

把身份(而非提示)作为咽喉点。 如果贵组织加入 Trusted Access for Cyber,那么账号上经过核验的个人,就成为审计的锚点。把每一次 GPT-5.5-Cyber 会话映射到一名指定操作员,记录 API key,并把两者绑定到工单或具体的服务任务上。蓝队侧同理:在事件窗口内,内部网段出现无法解释的、指向 api.openai.com 的出向流量,是一个值得深入的信号。
在 2026 年 6 月 1 日之前启用抗钓鱼认证。 OpenAI 的 Advanced Account Security 正在成为宽松层级的硬性要求。请在截止日前完成接入 —— 仅 passkey 或硬件密钥登录,不保留短信找回 —— 并使其与您对源代码平台已有的 SSO 策略保持一致。OpenAI 隐含防御的威胁模型,正是「账号劫持把一名合法红队成员的会话变成攻击性 AI 的代理」。
不要把模型自身的拒绝当作您的防御。 AISI 的六小时越狱,是正确的参考点。如果您的安全架构曾建立在「模型会拒绝替攻击者写这个」之上,请改掉它。在本月早些时候 Swept AI 的自适应攻击者研究中真正顶住的防御是 应用层的输出过滤,以及对模型可触及数据的访问控制,而不是模型的「良心」。请把同一教训应用于围绕 GPT-5.5-Cyber 的工作流:收窄 API key 权限、限制工具、记录输出、定期复核。
把 Daybreak 合作厂商的遥测纳入您的检测栈。 发布合作伙伴清单 —— Akamai、Cisco、Cloudflare、CrowdStrike、Fortinet、Oracle、Palo Alto Networks、Zscaler —— 意味着 GPT-5.5 级别的代理将开始出现在您已经在用的产品里。开启功能前,请先阅读每家厂商的集成披露文档;弄清楚代理能看到哪些数据、能调用哪些工具、其输出落到您 SIEM 的何处。在发版说明中那行「AI feature update」,正越来越多地决定您的承载面。
为一波漏洞披露做好规划。 AISI 的博文与 NCSC 关于迎接「补丁浪潮」的指南同期发布并非巧合。如果 Daybreak 兑现 OpenAI 的合作伙伴博文所述 —— 漏洞分流与补丁验证的速度提升一个数量级 —— 那么接入它的厂商之后将带来更多、更快的披露。请现在就收紧面向互联网资产的补丁 SLA。
针对「宽松模型落入被攻破但已受信账号之手」开展桌面演练。 您的 IR 计划大概率已经覆盖了「攻击者拿到我的源代码」和「攻击者拿到我的 CI/CD」。请追加一项「攻击者拿到一个被盗的 OpenAI 网络受信 token,以及三小时的 API 预算」,然后推演他能针对您的资产清单产出什么。蒙特雷供水公司的报告(我们的报道)展示了:一个未对齐的操作者,借助通用版的 Claude,已经能对真实 OT 环境造成什么后果;宽松层级则把同一工作流上的摩擦进一步抹平。

状态

项目	参考来源	日期	备注
GPT-5.5-Cyber 预览开放	Help Net Security	2026-05-07	限定预览,仅限受核验团队
Daybreak 平台发布	OpenAI / The Hacker News	2026-05-10 → 2026-05-12	基于 GPT-5.5 + GPT-5.5-Cyber + Codex Security
AISI 网络能力评测发布	UK AISI	2026-04-30	专家级通过率 71.4%;TLO 完成 2/10;rust_vm 用时 10:22
通用越狱被发现	UK AISI 红队	2026-04	6 小时专家红队工作;最终修复未经独立验证
Advanced Account Security 强制启用	OpenAI	2026-06-01	仅 passkey / 硬件密钥,无 SMS 找回
能力分级	OpenAI Preparedness Framework	2026-05	仍低于「Critical Capability」阈值
发布合作伙伴	OpenAI	2026-05	Akamai、Cisco、Cloudflare、CrowdStrike、Fortinet、Oracle、Palo Alto Networks、Zscaler

理解 Daybreak 的正确框架,不是「OpenAI 在交付一款攻击性 AI」,而是「攻击能力其实早已存在于 GPT-5.5 之中,Daybreak 是 OpenAI 在它周围搭建的访问控制架构」。在未来 12 至 24 个月里,防御方应同时为两种现实做规划:一层经过核验、可被审计的合法红队用户,拥有相当快的能力;另一层未经核验,同样的能力将以越狱、被盗账号或开源权重模型的追赶为路径浮现。两者都必须出现在威胁模型里。

OpenAI Daybreak 与 GPT-5.5-Cyber:身份核验闸门背后的「宽松」安全模型

这是什么?

它是如何运作的?

为什么重要

防御

状态

Sources