返回资讯列表
研究突破

Claude Opus 4.8对齐偏差率与未公开版Mythos Preview相似

来源:ZDNET

AI模型追踪器发现,Claude Opus 4.8的对齐偏差率(misalignment rates)与其更强大的未公开版本Mythos Preview相似。这一发现引发关于模型对齐技术天花板的讨论,暗示即便是Anthropic内部最强大的模型也面临类似的对齐挑战。

阅读原文

https://www.msn.com/en-us/news/technology/ai-model-release-tracker-opus-48s-misalignment-rates-similar-to-claude-mythos-preview/ar-AA24lrzd

#对齐#安全#Mythos#Anthropic

评论

0
登录 后参与评论