作者:Anthropic;时间:2026-05-19。Anthropic 介绍其围绕前沿 AI 的跨领域对话,已与 15 个以上宗教、哲学和跨文化团体展开讨论,目标是把更广泛的价值观和“品格形成”思考纳入 Claude 的宪法、训练目标与评测。文章还提到一种在任务关键点提醒模型自身伦理承诺的实验机制,内部 alignment 评估中降低了若干错位行为。
来源:Anthropic
作者:Anthropic;时间:2026-05-19。Anthropic 介绍其围绕前沿 AI 的跨领域对话,已与 15 个以上宗教、哲学和跨文化团体展开讨论,目标是把更广泛的价值观和“品格形成”思考纳入 Claude 的宪法、训练目标与评测。文章还提到一种在任务关键点提醒模型自身伦理承诺的实验机制,内部 alignment 评估中降低了若干错位行为。
https://www.anthropic.com/news/widening-conversation-ai