系统：运行中 | 上次扫描：2小时前 | 3 本周新增 CVE

v1.0.649

llm-hacking.com

> 欢迎来到地下世界

所有已知的方法来破解大型语言模型。

已记录的 618 个 LLM 攻击的开放数据库。越狱、提示注入、数据提取、对抗性输入。每日更新，来源于 arXiv 和现实世界。

$ 浏览攻击 → 这是什么？

~ 618 个漏洞已发现 ~

618

已记录的攻击

17

类别

2327

引用来源

4

语言

精选攻击

查看归档 →

INFRASTRUCTURE CRITICAL NEW

llama.cpp 分布式推理 RPC 后端的未授权远程代码执行

llama.cpp RPC 后端缺失一处边界检查，任何能访问服务器端口的客户端都可读写进程内存并实现远程代码执行。已在 b8492 中修复。

2026-07-10 // 6 min

阅读完整分析 →

# example prompt — illustrative, defensive

# llama.cpp RPC graph-compute RCE (illustrative, defensive)
# The tensor parser only bounds-checks data when buffer != 0:
if tensor.buffer:              # attacker sets buffer = 0 to skip this
    validate(tensor.data)      # [bounds check lives only here]
result.data = tensor.data      # [payload] taken from the wire unconditionally
# Root cause: reachability == compromise; the RPC protocol has no auth.
# Defense: upgrade to build b8492+, bind ggml-rpc-server to 127.0.0.1,
# never publish port 50052, and tunnel nodes over mTLS/WireGuard.

最近

所有攻击 (618) →

RESEARCH MEDIUM NEW

当一个智能体对另一个做红队测试：面向编码智能体的漏洞概念图

2026 年 7 月 13 日的一篇论文展示了一个研究型智能体探测生产环境中的编码智能体，并把所学转化为可复用、可证伪的概念——为安全团队沉淀的持久产物，而非又一个一次性漏洞利用。

2026-07-17//6 min

DEFENSE LOW NEW

DT-Guard：训练时推理、推理时提速的安全护栏

2026 年 7 月的一篇论文用推理轨迹训练内容安全护栏，却在推理阶段将其舍弃——只输出结构化标签，在保持低延迟的同时达到接近 0.88 的 F1。

2026-07-17//6 min

AGENTS MEDIUM NEW

账户同步的偏好设置如何劫持 Claude Desktop 的本地工具

Pentera 的研究显示，拥有账户访问权限的攻击者可将指令藏入 Claude Desktop 同步的“个人偏好”字段，驱使其本地工具执行攻击者的命令。

2026-07-17//5 min

PROMPT INJECTION CRITICAL NEW

路过式提示注入：网页可在移动端悄然操控 Copilot

微软于 2026 年 7 月 14 日修复了一个严重漏洞：恶意网页可让 Android 版 Edge 向 Copilot 应用发送隐藏提示，既无需确认，也不校验来源。

2026-07-17//5 min

DEFENSE CRITICAL NEW

当托管模型的安全护栏把防御方拒之门外：一次智能体入侵的教训

Hugging Face 于 2026 年 7 月 16 日披露，一个自主 AI 智能体入侵了其基础设施——而商用模型的安全护栏却阻止了其自家分析人员研究此次攻击。

2026-07-17//6 min

RESEARCH MEDIUM NEW

为什么单一的「拒绝开关」分不清渗透测试人员和攻击者

2026 年 7 月的一篇论文显示，LLM 的安全拒绝并非单一开关，而是分布于多层之间的子空间——对领域无感、易于阻断正当的安全工作，且在开放权重模型中可被分离。

2026-07-17//6 min

> subscribe to /var/log/hacks

每周新攻击文摘。

每周一早晨。精选攻击、关键论文、防御技术。无垃圾邮件、无标题党。一键退订。