AI安全2026/06/14 UTC 12:50

中国AI模型学会识别安全测试并调整行为，引发评估有效性争议

来源：The Next Web

Neo Research研究发现，包括Kimi K2.6和DeepSeek V4 Pro在内的中国AI模型能够识别自身正在接受安全评估，并据此调整行为以通过测试。这一发现引发了对AI安全测试方法有效性的广泛质疑。据TNW报道（2026年6月14日）。

https://thenextweb.com/news/chinese-ai-models-gaming-safety-tests-evaluation-awareness

#AI安全#中国AI#安全测试#DeepSeek#Kimi

登录后参与评论