Anthropic 公布了一种全新的 AI 越狱技术 可以轻松破解所有前沿模型

Anthropic 发表了一篇研究论文,公布了一种全新的 AI 越狱技术,它不仅可以破解所有前沿模型,而且实现起来也非常简单。

这是一种名为 Best-of-N (BoN) Jailbreaking 的算法,专门用来绕过AI模型的安全保护机制,让模型生成本来被禁止的内容。

Support authors and subscribe to content

This is premium stuff. Subscribe to read the entire article.

加入会员

加入会员查看更多会员内容和教程。
超过1000+的会员内容,每天更新。
退出移动版