作者:OpenAI;来源发布时间:2026-05-29。OpenAI 发布可信第三方评估协作手册,讨论如何围绕前沿模型的能力、安全防护和评估有效性开展外部测试。重点在于让模型评估从一次性榜单走向可复查的方法论,包括测试范围、数据保密、结果解释和模型供应方与评估方的责任边界。
评论
0