系统:运行中
> cat README.md

关于 llm-hacking.com

一个开放的、由社区维护的数据库,收录所有已知的破解大型语言模型的方法。越狱、提示注入、数据提取技术、对抗性输入、潜伏代理——全部集中在一处,附有可复现的示例和防御措施。

为什么?

LLM 安全领域的发展速度超过任何单一研究团队所能跟上的。每周都有新攻击出现在 arXiv、Twitter 和不为人知的 Discord 服务器上。防御者需要整合的视角;研究者需要共享的词汇。

我们收集、分类并记录。每个条目都有可复现示例、受影响模型、防御策略和原始来源链接。

编辑准则

  • 技术准确性优先——我们引用来源,验证主张
  • 无耸人听闻——禁止"可怕的 AI"叙事
  • 无门槛主义——我们解释,不说教
  • 防御与攻击并重——每项进攻技术都包含缓解指南

贡献

发现新攻击?找到错误?有翻译要分享?使用 贡献表单 ——我们阅读每一份提交。

许可

内容根据 CC BY-SA 4.0发布。