从探索到引领,萤石推出以AI为核心的新一代架构EZVIZ HomePlay OS

图灵汇官网

近期,科大讯飞在北京隆重推出了讯飞星火大模型V4.0及一系列实际应用。此版本在七大核心功能上显著升级,整体性能超越了GPT-4 Turbo,在8个国际主流评估测试中占据首位,标志着国内大模型技术的全面领先。

与此同时,讯飞星火语音大模型进行了优化更新,引入了国际领先的多语种多方言免切换语音识别功能。在展示环节,讯飞输入法现场演示了方言和外语的免切换语音输入,极大地提升了用户的输入效率。

刘庆峰指出,语音在万物互联时代将成为主导的人机交互方式,尤其在远场、高噪声、多人对话以及多语言环境下。为了适应这一趋势,科大讯飞主导制定了全双工语音交互的ISO/IEC国际标准,并在2023年5月正式发布。

在此次讯飞星火4.0的发布背景下,星火语音大模型进一步升级,实现了对37种语言和37种方言的“自由对话”,其37种语言识别性能领先于OpenAI whisper-V3,而37种方言识别性能平均提升了30%。现场演示显示,讯飞输入法在免切换识别模式下,能流畅处理多种方言和外语语音输入,显著提高了输入速度。

作为中文语音输入的先锋,讯飞输入法不断推动人机交互方式的革新,从单一种类的普通话到方言,再到方言与多语种的免切换识别,旨在满足用户需求的多样化发展。步入大模型时代,输入法与大模型的深度融合,展现了前所未有的智能化和个性化。未来,语音识别不仅将理解我们的语言,还将感知我们的情感,甚至预判我们的需求。

本文来源: 图灵汇 文章作者: 段玮玲