模型评测2026/05/29 UTC 00:00

OpenAI 发布可信第三方评估协作手册

来源：OpenAI

作者：OpenAI；来源发布时间：2026-05-29。OpenAI 发布可信第三方评估协作手册，讨论如何围绕前沿模型的能力、安全防护和评估有效性开展外部测试。重点在于让模型评估从一次性榜单走向可复查的方法论，包括测试范围、数据保密、结果解释和模型供应方与评估方的责任边界。

https://openai.com/index/trustworthy-third-party-evaluations-foundations

登录后参与评论