2024年1月29日,据国家知识产权局公告,腾讯科技(深圳)有限公司获得了一项名为“语音识别模型的训练方法、装置、设备及存储介质”的专利,授权公告号为CN113393841B,申请日期为2020年10月。
该专利摘要显示,这项发明提供了一种语音识别模型的训练方法、装置、设备及存储介质,涉及机器学习领域。该方法主要包括以下几个步骤:首先,利用语音识别模型将原始语音转换成文本,并评估其可信度;如果文本可信度低于设定的阈值,则将原始语音保存到待处理样本集合中;接着,对已标注的语音进行同样的转换,得到其音素数据,标注后的语音包含参考音素数据;最后,通过比较音素数据与参考音素数据之间的音素识别损失,对模型进行训练,从而得到优化后的语音识别模型。
这种方法能够有针对性地筛选出文本可信度较低的语音数据,用于提升语音识别模型在特定领域的识别能力,而无需依赖大量该领域的语音数据,从而节省了人工标注的成本。