腾讯公司取得语音识别模型训练专利，提升新知识领域的语音识别能力

投稿
APP
微信扫一扫获取更多

腾讯公司取得语音识别模型训练专利，提升新知识领域的语音识别能力

韶华杂谈

2024-01-29 17:09:12

图灵汇官网

2024年1月29日，据国家知识产权局公告，腾讯科技（深圳）有限公司获得了一项名为“语音识别模型的训练方法、装置、设备及存储介质”的专利，授权公告号为CN113393841B，申请日期为2020年10月。

该专利摘要显示，这项发明提供了一种语音识别模型的训练方法、装置、设备及存储介质，涉及机器学习领域。该方法主要包括以下几个步骤：首先，利用语音识别模型将原始语音转换成文本，并评估其可信度；如果文本可信度低于设定的阈值，则将原始语音保存到待处理样本集合中；接着，对已标注的语音进行同样的转换，得到其音素数据，标注后的语音包含参考音素数据；最后，通过比较音素数据与参考音素数据之间的音素识别损失，对模型进行训练，从而得到优化后的语音识别模型。

这种方法能够有针对性地筛选出文本可信度较低的语音数据，用于提升语音识别模型在特定领域的识别能力，而无需依赖大量该领域的语音数据，从而节省了人工标注的成本。