科普系列 | 漫威电影中的高科技8——“图灵测试”

图灵汇官网

在电影《钢铁侠3》中,女主角小辣椒误以为托尼·斯塔克在战甲里,经过长时间的对话才发现托尼其实不在里面,这让小辣椒感到非常生气。同样,在电影《蜘蛛侠:英雄归来》中,蜘蛛侠帕克也没有辨认出托尼是否在战甲中。这些情节引发了人们对人工智能(AI)的思考:当机器和人类之间的界限变得模糊时,我们能否认为AI已经具备了真正的智能?

艾伦·图灵,被誉为“人工智能之父”,在他的论文《计算机器与智能》中提出了著名的“图灵测试”。图灵测试的目的是评估计算机是否具备人类智能。具体来说,如果一个人类测试者无法在一定时间内判断对话对象是人还是机器,那么这台机器就被认为具有人类智能。

1952年,图灵在BBC广播中详细阐述了图灵测试的具体实施方法。测试中,人机对话通过特殊的装置(如键盘)进行,测试者可以向机器提出各种问题。如果超过30%的测试者无法确定对话对象是人还是机器,那么这台机器就通过了测试。30%的及格线成为了图灵测试的一个重要标志。

尽管图灵测试自1950年以来一直被视为评估AI的重要标准,但至今仍没有计算机真正通过这一测试。直到2014年,在英国皇家学会举办的“2014图灵测试大会”上,由俄罗斯科学家开发的聊天程序“尤金·古斯特曼”以一个13岁男孩的身份,成功骗过了三分之一的评委,被认为是通过了图灵测试。

然而,通过图灵测试并不意味着计算机真正具备了人工智能。事实上,许多通过图灵测试的程序往往通过模仿儿童或来自偏远地区的角色来降低测试者的期望值。例如,“尤金·古斯特曼”模拟了一个来自较小城市、非英语母语的13岁男孩,从而巧妙地回避了一些常识性问题。

当前市面上的人工智能产品,如微软小冰、苹果Siri、小度和小爱同学等,虽然在某些方面已经能够与人类进行有效的互动,但它们主要依赖于预设的数据和模式匹配,属于“弱人工智能”。它们无法深入理解和处理复杂的语言和情境。

图灵测试的核心在于区分人和机器,但随着技术的发展,图灵测试也逐渐显现出局限性。未来,如果计算机真的拥有了接近人类的智能水平,它们可能会采取策略不通过图灵测试,以保护自身的利益。这种情况下,图灵测试可能不再是一个可靠的评估标准。

总之,尽管图灵测试在评估AI方面起到了重要作用,但它并不能完全衡量一个系统是否具备真正的智能。随着技术的进步,未来的评估标准也需要不断更新和完善。

本文来源: 图灵汇 文章作者: 粤闽探索