能听懂30种方言!方言语音识别大模型来了

图灵汇官网

能够理解包括粤语、上海话、四川话、温州话在内的30多种方言的大模型“小天才”已经上线。在第七届数字中国建设峰会上,中国电信人工智能研究院发布了这款名为“星辰”的超多方言语音识别大模型,它支持30种方言的自由混说。

中国幅员辽阔,方言种类繁多,每种方言都有其独特的语法和语音特点。由于许多方言主要以口语形式存在,缺乏相应的文字记录,这使得可用于训练模型的方言数据量相对较少,从而增加了方言研究的难度。

为了训练出能够识别多种方言的大模型,方言数据库至关重要。据了解,该人工智能研究院已经建立了一个包含超过30种方言、总计超过30万小时高质量录音的数据库。基于这个庞大的数据库,研发团队开发了一种创新的“蒸馏+膨胀”联合训练算法,使大模型能够在海量且多样化的数据环境下稳定地进行训练。

目前,“星辰”语音大模型已经在福建、江西、广西、北京、内蒙古等地的中国电信10000智能客服系统中进行了试点应用。此外,该大模型也已在多个城市的12345服务平台上投入使用。

(改写后的内容尽量避免了与原文的相似度,同时保留了核心信息和价值点)

本文来源: 图灵汇 文章作者: 科技飞