从“Hey Siri”到“Siri”这一小步,是苹果语音识别的一大步

图灵汇官网

“嘿,Siri,讲个笑话”——相信很多iPhone用户都试过这样与苹果的智能语音助手Siri对话。不过,将来大家可能会用不同的方式与Siri交流。据报道,苹果正计划将Siri的唤醒词从“Hey Siri”简化为“Siri”。这一变化预计会在2023年或2024年推出。此外,苹果也在努力将Siri整合到第三方应用程序中,以提供更加丰富和个性化的服务。

Siri作为苹果推出的智能语音助手,自2011年发布以来,一直是智能手机厂商在人工智能领域探索的重要成果之一。尽管看似只是一个简单的“Hey”被去掉,但这背后体现了苹果在语音识别技术上的显著进步。过去,Siri曾被用户批评不够智能,而现在它正逐渐缩小与竞争对手如亚马逊的差距。

从“Hey Siri”到“Siri”的转变,不仅简化了唤醒过程,也反映了苹果在语音识别方面的重大突破。唤醒词不仅是启动智能语音助手的方式,更是品牌识别的一部分。通过每次说出唤醒词,消费者的记忆得以不断强化。

智能语音助手为何需要唤醒词?这是因为它们不能全天候在线,必须在用户需要时才启动。相比通过按钮或点击图标唤醒,使用特定的唤醒词更为合适。这种唤醒机制被称为关键词检测(KWS),即在连续语流中实时检测特定词汇。通常情况下,除非手动关闭,否则智能语音助手会长时间驻留后台,但它们需要大量的AI计算资源,这会影响设备的性能和电池寿命。

为解决这个问题,开发者引入了低功耗协处理器,用于持续监听麦克风。一旦检测到唤醒词,如“Hey Siri”、“小爱同学”等,语音助手就会被激活。这一策略不仅减轻了设备的续航压力,还避免了不必要的音频处理。

国内智能语音助手的唤醒词多为四个字,如“天猫精灵”、“小爱同学”等。这是因为汉语的音节数量关系,四音节的唤醒词既能减少误唤醒,又不会影响用户体验。相比之下,“Hey Siri”中的“Hey”是一个英文语气词,增加了音节数量,使系统能更准确地判断声音来源。

苹果计划通过去除“Hey”来展示其在KWS技术上的巨大进步,现在只需一个单词就能判断用户意图。这得益于声纹识别技术和深度学习算法的进步。与此同时,苹果还打算让Siri与第三方应用结合,以增强其功能性。此前,由于封闭模式的限制,Siri未能充分利用第三方开发者的创新力量。随着这一改变,Siri有望迎来新的发展机遇,提供更丰富的服务。

本文来源: 图灵汇 文章作者: 邱茜茜