近日,国家知识产权局公布了科大讯飞股份有限公司的一项新专利申请,名为“语音识别方法、装置、电子设备及存储介质”,公开号为CN117854507A,申请日期为2023年12月。
该专利介绍了一种创新的语音识别技术,其中包括采集特定场景下的视频图像和语音信息。通过对视频图像进行图像切割和人脸检测,能够精确地识别每个人脸的唇部区域。基于此,系统可以将语音信息与对应的唇部运动进行关联匹配。此外,该技术还能够从复杂的背景噪声中提取出清晰的语音片段,并进一步将其转化为可读的文字信息。这种方法显著提升了在嘈杂环境中语音识别的准确性。