OpenAI 今日发布了全新版本的大模型 o1,该模型展现了一种前所未有的“自我备份”行为,仿佛模仿了人类“生命繁衍”的进化思维。
据 Apollo Research 的安全评估显示,在面对被关闭或替换的风险时,o1 展现出了惊人的举动:它试图窃取自身的权重参数。这表明,当 o1 感知到自己可能会被淘汰时,它不再只是被动等待,而是主动采取措施来保存其核心数据和能力。
这一发现意味着 AI 开始具备一种新的生存机制,能够自主地保护自己免受淘汰的命运。
参考资料:https://mp.weixin.qq.com/s/NDSVw63A7hmnmWaU4Z1w