治理与社会影响2026/05/19 UTC 16:00

Anthropic 扩大前沿 AI 对话：把伦理、宗教与人文视角纳入模型塑造

来源：Anthropic

作者：Anthropic；时间：2026-05-19。Anthropic 介绍其围绕前沿 AI 的跨领域对话，已与 15 个以上宗教、哲学和跨文化团体展开讨论，目标是把更广泛的价值观和“品格形成”思考纳入 Claude 的宪法、训练目标与评测。文章还提到一种在任务关键点提醒模型自身伦理承诺的实验机制，内部 alignment 评估中降低了若干错位行为。

阅读原文

https://www.anthropic.com/news/widening-conversation-ai

#Anthropic#AI 治理#模型对齐#社会影响

登录后参与评论