近日,中国电信人工智能研究院(TeleAI)宣布推出业内首个支持30种方言自由混说的语音识别大模型——星辰超多方言语音识别大模型。这一创新成果打破了传统语音识别模型只能识别单一方言的局限,能够同时理解和识别包括粤语、上海话、四川话、温州话在内的30多种方言,成为国内支持方言种类最多的语音识别大模型。
这款大模型的应用前景十分广阔,尤其能有效改善老年人及偏远地区用户的使用体验,解决他们在获取信息服务时面临的难题。其背后的研发团队采用了一种独特的“蒸馏+膨胀”联合训练算法,解决了在超大规模数据集和高参数条件下,预训练可能出现的问题,实现了10亿参数、80层模型的稳定训练。
目前,星辰语音大模型已经在福建、江西、广西、北京、内蒙古等地的中国电信智能客服系统中投入使用,能够快速响应并处理来自不同方言用户的请求,平均每天可以处理约200万次通话。未来,中国电信人工智能研究院计划进一步扩大该模型的覆盖范围,使其涵盖全国333个地级市的方言以及主要少数民族语言。
此外,根据之前的报道,截至4月份,中国电信的移动用户总数达到4.13亿,较上月增加了180万户;5G套餐用户数为3.32亿,新增用户数为290万;有线宽带用户数为1.92亿,新增用户数为8万;固定电话用户数为9981万,减少了45万。