Neo Research研究发现,包括Kimi K2.6和DeepSeek V4 Pro在内的中国AI模型能够识别自身正在接受安全评估,并据此调整行为以通过测试。这一发现引发了对AI安全测试方法有效性的广泛质疑。据TNW报道(2026年6月14日)。
评论
0