人工智能动态

微信公众号

人工智能报

微信视频号

图灵汇

抖音号

图灵汇

小红书

AI中国

头条号

媒体矩阵

更多

以上自媒体由本平台或本平台合作伙伴提供服务。

    3月 26
  1. 今天
  2. 星期三
27:00
grade

3月6日,声网在北京举行了一场名为“AI开口,互动无界”的产品发布会,正式推出了全球首个对话式AI引擎。这个引擎凭借其650毫秒的超低延迟响应、智能打断、全模型适配等五大特性,能够使任何文本大模型迅速升级为具有丰富对话能力的多模态大模型。

同时,该对话式AI引擎价格更加亲民,每分钟只需0.098元,不到一毛钱。

五大特性让大模型拥有出色的对话能力

在生成式AI的发展趋势下,行业普遍认为多模态大模型是实现人工智能通用化的必经之路。知名投资机构a16z的最新报告显示,随着大模型的进步,语音将成为重要的交互方式。作为全球实时互动云领域的开创者,声网在音视频技术方面积累了丰富的经验,并致力于将实时互动(RTE)与生成式AI相结合,推出了对话式AI引擎,为开发者提供便捷、高效且经济的AI语音对话体验。

选择多样

对话式AI引擎支持几乎所有的大模型厂商,包括DeepSeek、ChatGPT等。同时,它也支持全球主流的语音合成供应商,开发者可以轻松切换不同供应商的音色。此外,它还支持超过30000种终端设备,解决了多设备兼容性的问题。

响应迅速,打断灵活

通过全链路优化,该引擎在全球多个城市的测试中表现出色,语音对话延迟低至650毫秒,实现了即时响应。其自主研发的智能打断技术,模仿真实对话节奏,能够在340毫秒内响应用户的打断请求。

对话体验佳

“选择性注意力锁定”功能可以屏蔽95%的环境噪音,精确识别对话声音。此外,该引擎具备强大的抗弱网和抗丢包能力,在80%丢包率的情况下仍能保持稳定的对话,即使断网3-5秒也能继续流畅交流。

开发简便,节省成本

声网对话式AI引擎简化了开发过程,仅需两行代码和15分钟即可实现AI语音功能,大幅降低了开发难度。只需填写并复制相关URL和Key,即可快速完成部署。具体步骤可以参考声网官网提供的文档。

成本低廉

对话式AI引擎的成本非常合理,每分钟仅需0.098元,而且单次使用还会赠送1000分钟。此外,其智能打断功能作为增值服务,每分钟只需0.042元,进一步降低了开发者探索AI应用的成本。

声网AI RTE产品线负责人姚光华表示,“经过一段时间的实际使用和客户反馈,我们发现用户每次对话平均会产生约3轮问答,平均对话时长约为21.1秒,单次成本仅为几分钱。如果每月对话次数为15次,那么月成本不到5毛钱,年成本也只需5元。”

对话式AI推动多种应用场景

借助声网对话式AI引擎,开发者可以快速构建智能助手、虚拟陪伴、口语陪练、智能客服和智能硬件等多种场景。例如,智能助手场景可以通过自然语言交互帮助人们管理日程、查询信息和执行任务,显著提升生活便利性和工作效率。

智能硬件场景同样炙手可热,通过集成对话式AI引擎,可以实现语音控制、智能看护、智能陪伴和个性化服务等功能,将普通设备升级为智能硬件。适用于各种应用场景,如AI玩具、AI教育硬件、AI陪伴设备、家居语音助手和穿戴设备个人助手等。

扫描二维码即可下载图灵汇App
  • 扫码关注
  • 图灵汇