2024年5月11日,国家知识产权局发布了一项新专利公告,腾讯科技(深圳)有限公司获得了名为“一种语音识别模型训练方法、装置、电子设备及存储介质”的专利,授权公告号为CN112185361B,申请日期为2020年9月。
该专利摘要显示,这项发明提供了一种语音识别模型训练的方法、装置、电子设备及存储介质。该方法包括以下几个步骤:首先,对需要识别的音频信息对应的标注文本信息进行预处理,基于文本的目标类型;其次,在第一发音词典中添加目标类型文本信息对应的发音,从而形成第二发音词典;接着,基于第二发音词典生成与待识别音频信息对应的标注文本信息相匹配的发音序列;然后,确定训练样本集合;最后,确定语音神经网络的模型参数。
这一方法可以通过云计算技术,将广域网或局域网内的硬件、软件及网络资源统一起来,自动生成相应的发音序列,形成训练样本集合,进而对语音识别模型进行训练。这样可以有效减少因错误发音或遗漏发音信息导致的语音识别模型训练不准确的问题。