能听懂30种方言！方言语音识别大模型来了_图灵汇

投稿
APP
微信扫一扫获取更多

能听懂30种方言！方言语音识别大模型来了

科技飞

2024-05-27 08:26:04

图灵汇官网

能够理解包括粤语、上海话、四川话、温州话在内的30多种方言的大模型“小天才”已经上线。在第七届数字中国建设峰会上，中国电信人工智能研究院发布了这款名为“星辰”的超多方言语音识别大模型，它支持30种方言的自由混说。

中国幅员辽阔，方言种类繁多，每种方言都有其独特的语法和语音特点。由于许多方言主要以口语形式存在，缺乏相应的文字记录，这使得可用于训练模型的方言数据量相对较少，从而增加了方言研究的难度。

为了训练出能够识别多种方言的大模型，方言数据库至关重要。据了解，该人工智能研究院已经建立了一个包含超过30种方言、总计超过30万小时高质量录音的数据库。基于这个庞大的数据库，研发团队开发了一种创新的“蒸馏+膨胀”联合训练算法，使大模型能够在海量且多样化的数据环境下稳定地进行训练。

目前，“星辰”语音大模型已经在福建、江西、广西、北京、内蒙古等地的中国电信10000智能客服系统中进行了试点应用。此外，该大模型也已在多个城市的12345服务平台上投入使用。

（改写后的内容尽量避免了与原文的相似度，同时保留了核心信息和价值点）

方言听懂语音识别模型

本文来源：图灵汇文章作者：科技飞

: 让企业摸着“京东”过河，解密京东云言犀AI，最接地气的数智供应链答案
图灵汇

: 海尔智家邓邱伟：一个“智家大脑”如何颠覆智能家居体验？
图灵汇

: 突发机器人龙头曝大幅裁员，CEO公开发话行业凛冬将至！
图灵汇

: 阿里达摩院田彪：如何用“模组化”解决AI语音场景“碎片化”痛点？
图灵汇

: 暌违四年，优傲新品重新“定义”协作机器人
图灵汇

: 谷歌迄今最贵 AI 模型：Gemini 2.5 Pro API 定价公布，每百万输入 tokens 1.25 美元起
图灵汇

: 三星 Galaxy XCover7 Pro 三防手机曝光：骁龙 7s Gen 3 芯片、5000 万主摄，599 欧元
图灵汇

: 微软 Bing 重大革新：Copilot Search 上线，AI 与传统搜索结合
图灵汇

: 比尔・盖茨：我们生来不是为了工作，AI 将取代人类做大部分事情
图灵汇

: 微软 Copilot 变身“AI 管家”：一句话搞定订票购物
图灵汇

下一篇

科大讯飞获得发明专利授权：“一种语音识别方法、装置、设备及存储介质”

科技飞

2024-07-08

19