返回资讯列表
AI研究

Princeton CEO-Bench揭示:大多数AI模型无法成功经营公司

来源:Tech Times

据Tech Times报道(2026年6月29日),普林斯顿大学发布的CEO-Bench基准测试让14个AI模型用100万美元模拟运营一家SaaS创业公司500天。结果大多数模型破产或亏损,仅Claude Fable 5、Opus 4.8和GPT-5.5实现盈利,而无AI的规则基线策略也获得正回报。

阅读原文

https://www.techtimes.com/articles/319294/20260629/most-ai-models-would-run-your-company-ground-princetons-ceo-bench-finds.htm

#AI评估#基准测试#Princeton#Agent

评论

0
登录 后参与评论