据Tech Times报道(2026年6月29日),普林斯顿大学发布的CEO-Bench基准测试让14个AI模型用100万美元模拟运营一家SaaS创业公司500天。结果大多数模型破产或亏损,仅Claude Fable 5、Opus 4.8和GPT-5.5实现盈利,而无AI的规则基线策略也获得正回报。
来源:Tech Times
据Tech Times报道(2026年6月29日),普林斯顿大学发布的CEO-Bench基准测试让14个AI模型用100万美元模拟运营一家SaaS创业公司500天。结果大多数模型破产或亏损,仅Claude Fable 5、Opus 4.8和GPT-5.5实现盈利,而无AI的规则基线策略也获得正回报。
https://www.techtimes.com/articles/319294/20260629/most-ai-models-would-run-your-company-ground-princetons-ceo-bench-finds.htm
评论
0