Anthropic 公布了一种全新的 AI 越狱技术可以轻松破解所有前沿模型

by 小互
2天 ago

Anthropic 发表了一篇研究论文，公布了一种全新的 AI 越狱技术，它不仅可以破解所有前沿模型，而且实现起来也非常简单。

这是一种名为 Best-of-N (BoN) Jailbreaking 的算法，专门用来绕过AI模型的安全保护机制，让模型生成本来被禁止的内容。

Support authors and subscribe to content

This is premium stuff. Subscribe to read the entire article.

Login if you have purchased

加入会员

加入会员查看更多会员内容和教程。
超过1000+的会员内容，每天更新。

开通会员

Categories: AI 论文

退出移动版