2024年1月11日,国家知识产权局发布公告,腾讯科技(深圳)有限公司获得了一项名为“一种语音识别方法及装置”的专利授权,授权公告号为CN112002308B,申请日期为2020年10月。
该专利涉及计算机技术领域,特别是语音识别方法及装置。其主要步骤包括:获取待识别的音频帧序列;提取每个音频帧的声学特征;根据这些声学特征和预先生成的解码图,对音频帧序列进行解码,从而确定对应的词语识别结果。其中,解码图是由声学模型和发音词典共同生成的。声学模型用于识别音素,而发音词典则用于识别已知音素对应的词语文本以及未知音素的音素文本表示的词语文本。这种方法能够自动发现新词和不同的发音,从而提升语音识别的准确性。