AI风险谁来防护？图灵奖得主：还是AI

38:23

标题：图灵奖得主Yoshua Bengio携手英国政府，推进AI安全守护项目

现代人工智能领域的领军人物、图灵奖得主Yoshua Bengio，正全心投入一个旨在为AI系统嵌入安全机制的项目。此项目，名为“AI安全守护者”，由英国政府资助。Bengio担任项目的科学总监，为项目提供关键性意见和科学指导。

“AI安全守护者”项目的目标是创建一种AI系统，能够评估关键领域中部署的AI系统的安全性。在过去的四年里，项目获得了5900万英镑的资金，由英国高级研究与发明署（ARIA）提供。ARIA成立于去年一月，旨在投资具有变革潜力的科学研究。

项目旨在构建能够提供定量保证的AI系统，比如风险评分，以评估其对现实世界的影响。ARIA的项目负责人David Dalrymple表示，该计划通过结合科学模型与数学证明，以弥补人工测试的不足，评估新系统的潜在危害。

项目期望通过融合科学模型与数学证明，构建AI安全机制，以实现AI系统的自我理解和风险降低。设想中的“AI守门员”将负责监控并降低其他AI代理的安全风险，确保在高风险领域运营的AI系统（如交通或能源系统）能够按预期运行。

Dalrymple和Bengio指出，当前缓解高级AI系统风险的技术，如红队测试，存在局限性，无法完全依赖这些手段确保关键系统安全。他们希望项目能够提供新的方法，减少对人力的依赖，更多依赖数学确定性。

ARIA不仅为AI安全机制提供了资金，还向涉及高风险行业的个人或组织提供资金，帮助他们开发相关应用。第一年资金总额为540万英镑，之后每年增加820万英镑，申请截止日期为10月2日。

项目还寻求与非营利组织合作，构建AI安全机制，ARIA计划投入高达1800万英镑，预计在明年年初接受资金申请。项目目标是创建一个拥有多元化董事会的非营利组织，涵盖多个行业，以可靠和可信的方式开展工作。

首届AI安全峰会在2023年11月举办，汇集了全球领导人和技术专家，共同探讨如何安全地构建技术。尽管资助计划倾向于英国本土申请人，但ARIA在全球范围内寻找有兴趣来到英国的AI人才。此外，ARIA还有一套知识产权机制，允许海外营利性公司受益，并让版税返回英国。

Yoshua Bengio主导了《国际高级AI安全科学报告》，涉及全球30个国家及欧盟和联合国。他对该项目的兴趣在于其促进全球范围内AI安全的合作，以及他作为AI安全倡导者的角色，曾参与过警告超级智能AI可能带来的生存风险的影响力游说团体。

Bengio认为，通过这个项目，AI风险的讨论得以扩大至更广泛的全球参与者，使得实现AI安全的目标更进一步。

登录