AI模型追踪器发现,Claude Opus 4.8的对齐偏差率(misalignment rates)与其更强大的未公开版本Mythos Preview相似。这一发现引发关于模型对齐技术天花板的讨论,暗示即便是Anthropic内部最强大的模型也面临类似的对齐挑战。
来源:ZDNET
AI模型追踪器发现,Claude Opus 4.8的对齐偏差率(misalignment rates)与其更强大的未公开版本Mythos Preview相似。这一发现引发关于模型对齐技术天花板的讨论,暗示即便是Anthropic内部最强大的模型也面临类似的对齐挑战。
https://www.msn.com/en-us/news/technology/ai-model-release-tracker-opus-48s-misalignment-rates-similar-to-claude-mythos-preview/ar-AA24lrzd
评论
0