百度吴恩达：语音是人机交互最自然的方式

投稿
APP
微信扫一扫获取更多

百度吴恩达：语音是人机交互最自然的方式

骆耀斌

2016-11-22 18:58:00

【科技界全球关注】11月22日，百度语音开放平台庆祝其三周年庆典活动在北京举行。在此次盛会上，百度宣布了四项关键语音技术的开放：情感合成、远场解决方案、唤醒二期以及长语音方案，为开发者提供了免费接入途径。百度的首席科学家吴恩达在主题演讲中阐述了这一举措的意义，他表示：“语音作为人类沟通和人机交互的自然媒介，通过开放技术，我们旨在激发语音功能产品的繁荣浪潮。”

在庆典上，吴恩达深入解析了百度人工智能的核心成就“百度大脑”，并介绍了其构成要素，包括语音、图像、自然语言处理、用户画像和机器学习等五大核心部分。他强调，百度语音开放平台注册开发者数量已突破14亿大关，每日在线识别请求量高达1.4亿次，语音合成请求量达到2亿次，这充分体现了技术开放对于开发者实际价值的显著提升。

此外，吴恩达对人工智能的未来发展持有乐观态度，预见到未来将出现如陪伴机器人、个性化私教、音乐创作助手、机器人医生等应用。人工智能技术的快速进步，为各行各业带来了前所未有的机遇。

在演讲中，吴恩达回顾了百度大脑的发展历程，从2012年引入深度神经网络模型，到后续采用序列判别训练、长短期记忆（LSTM）模型以及条件随机场（CTC），再到今年推出深度卷积神经网络（CNN）模型，语音识别技术不断取得突破。与此同时，语音合成技术也在多个关键技术领域实现了显著进展，百度在语音合成领域的实力遥遥领先于行业同行。

吴恩达指出，百度大脑的技术不仅改变了人机交互的方式，也被全球科技界誉为2016年度十大突破性技术之一。他坚信，随着技术的持续创新，语音技术将在智能家居、智能手机、汽车等领域带来革命性的变革，助力打造更智能、便捷的生活环境。

在未来的展望中，吴恩达特别强调了语音输入的便利性和高效性，认为它是人类交流的自然方式。随着语音和自然语言处理技术的快速发展，未来语音输入将更加普及，成为人机交互的主要手段之一。通过百度提供的技术支持，开发者能够充分利用这些新技术，探索并实现创新应用，从而获得卓越的成果。

最后，吴恩达感谢了所有参与者，并表达了对百度大脑未来发展的期待。他坚信，通过持续的技术创新和开放合作，百度大脑将继续引领人工智能领域的发展，为全球开发者提供强大的技术支持，共同推动技术进步和社会发展。