人工智能动态

微信公众号

人工智能报

微信视频号

图灵汇

抖音号

图灵汇

小红书

AI中国

头条号

媒体矩阵

更多

以上自媒体由本平台或本平台合作伙伴提供服务。

    11月 19
  1. 今天
  2. 星期二
22:00
grade

国内首推超拟人交互语音模型——讯飞星火,引领智能语音新潮流

近日,科大讯飞发布了一款名为“星火”的超拟人交互语音大模型,该模型在响应速度、自然流畅度、情绪感知和情感共鸣等方面展现出超越常规的性能,为用户带来了如同电影《Her》中智能聊天效果般的全新体验。

响应与互动: - 极速响应:星火模型支持多轮交互,能迅速生成高质量回答,响应速度与GPT-4o媲美,几乎达到与人类对话的自然节奏,允许用户随时打断对话。 - 情绪感知:通过识别用户声音中的喜怒哀乐,星火能以适当的情感回应,增强交流的亲和力,如笑声回应开心,安慰悲伤情绪,甚至识别特定动物叫声给予相应反馈。

个性定制与角色扮演: - 用户可通过语音指令控制星火在情感、风格、方言和强度上做出个性化调整,如请求以调侃方式讲笑话、用东北话介绍美食或加快语速。 - 支持角色扮演功能,用户可以与模仿不同角色的超拟人进行对话,如模仿孙悟空的声音与儿童交谈。

技术创新与开放计划: - 星火采用统一神经网络实现语音到语音的端到端建模,优化了响应时间和交互质量。 - 结合多维度的语音属性解耦表征训练,星火能够灵活控制内容、音色、情感、语言和风格,满足定制化需求。 - 计划于8月底向公众全面开放,后续将持续在交互体验上进行创新,拓展更多功能,并逐步融入更多模态。

智能语音领域的革新与机遇

华为科技有限公司副董事长徐直军在科大讯飞全球1024开发者节上表示,华为在智能终端的语音技术均采用科大讯飞的技术,这彰显了其在全球智能语音领域的领导地位。

这项技术突破不仅推动了智能语音交互的革新,还预示着语音市场可能迎来新一轮增长。智能语音技术将广泛应用于智能手机、智能汽车、家电及智能家居等设备,预计到2030年,全球智能语音服务市场规模将达到约731.6亿美元,复合增长率高达27%。

科大讯飞凭借此技术有望获得显著的产业红利,加速智能语音技术在消费级产品的应用,尤其在多语种、多方言的支持上,将进一步扩大其全球影响力。

扫描二维码即可下载图灵汇App
  • 扫码关注
  • 图灵汇