近日,据国家知识产权局公告,携程旅游网络技术(上海)有限公司申请了一项名为“说话人的语音识别方法、系统、电子设备及存储介质”的专利,公开号为CN117789728A,申请日期为2023年12月。
该专利介绍了一种新的语音识别技术。该技术包括以下几个步骤:首先获取目标音频,并对其进行语音识别处理,从而得到相应的文本;然后根据语义对文本进行断句处理,形成多个子句文本;接着对每个子句音频进行声纹识别,提取其声纹信息;最后,结合子句音频的声纹信息及其与当前场景的相关性,判断子句音频对应的说话人是否为主要说话人。
这项技术通过声纹识别和场景主题相关性的分析,解决了旁人说话带来的干扰问题,提升了语音对话中的交互体验。