腾讯宣布,全球首个以人工智能为核心的新一代实时语音编码行业标准AVS3P10即将面世。这一创新成果以腾讯自主研发的神经网络语音编解码器Penguins为核心,融合了AVS音频组多家单位的智慧。
AVS3P10标志着全球首次全面引入AI的语音编码技术,它在确保低码率传输的同时,实现了媲美国际顶尖水平的音质体验。相比当前主流标准,它仅需三分之一体码率,就能提供同样清晰的语音效果。
这一技术突破使得在线会议、语音通话等实时音频场景的网络带宽需求大幅减少。即便在网络条件较差的环境中,如电梯、地下车库或隧道内,也能保证清晰流畅的语音通话质量。
针对现有主流音频编码标准在低码率下音质下降的问题,腾讯会议天籁实验室研发出Penguins,以此为基础构建了AVS3P10标准的腾讯部分方案。通过将AI与传统技术深度结合,Penguins在算法、工程化和产品化方面进行了全面创新,超越了传统香农定理的性能极限,为下一代通信系统奠定了坚实的技术基础。
Penguins采用AI模型精确解析语音信号,提取关键特征参数,利用深度学习网络预测并重构语音细节,最终生成高度真实的音频波形。这种流程确保了编码效率的显著提升,尤其在有限带宽环境下,实现了高质量的语音通信体验。
自2021年起,Penguins音频编码器在腾讯会议多个应用场景中实现了大规模部署,支持数亿用户享受流畅沟通。无论是在复杂网络环境下,还是高速移动场景中,都能提供清晰的音频通信服务。腾讯于2023年3月提出并参与AVS3P10标准制定,最终在2024年6月完成标准化工作。
AVS3P10作为新一代语音编解码技术标准,填补了AVS系列标准的空白,代表了当前行业的最高水平。其在编解码、音频降噪、语音增强等方面的表现,彰显了腾讯在语音处理、AI技术创新及用户体验优化方面的强大实力。未来,腾讯将继续深化相关研究,不断优化实时音频通信解决方案,致力于为用户提供“听得清、听得真”的极致体验。
通过此次改写,我们保留了核心信息点,采用了不同的表述和结构,确保了与原文在语言风格和表达方式上的区别。