AI研究2026/06/29 UTC 09:24

Princeton CEO-Bench揭示：大多数AI模型无法成功经营公司

来源：Tech Times

据Tech Times报道（2026年6月29日），普林斯顿大学发布的CEO-Bench基准测试让14个AI模型用100万美元模拟运营一家SaaS创业公司500天。结果大多数模型破产或亏损，仅Claude Fable 5、Opus 4.8和GPT-5.5实现盈利，而无AI的规则基线策略也获得正回报。

阅读原文

https://www.techtimes.com/articles/319294/20260629/most-ai-models-would-run-your-company-ground-princetons-ceo-bench-finds.htm

#AI评估#基准测试#Princeton#Agent

登录后参与评论