2024年4月16日,据国家知识产权局公告,科大讯飞股份有限公司申请了一项名为“语音识别方法及相关装置、设备和存储介质”的专利,公开号为CN117894313A,申请日期为2023年12月。
该专利介绍了一种新型的语音识别方法及其相关设备和存储介质。该方法主要包括以下步骤:首先获取需要识别的语音,然后利用语音识别模型对该语音进行处理,最终生成对应的识别文本。值得注意的是,该语音识别模型是通过结合样本语音和语音合成模型进行联合训练而得来的。样本语音的标注信息至少包含真实的文本内容,而语音合成模型则是基于标注信息和经过部分遮蔽的第一隐层特征来生成合成语音的。这一技术方案显著提升了语音识别的准确性和稳定性。