北京时间本周三凌晨,OpenAI 首席产品官凯文·威尔(Kevin Weil)通过 X 平台宣布,高级语音模式(Advanced Voice Mode)将在本周正式上线 ChatGPT 网页版,并面向付费用户开放。
早在今年 9 月,OpenAI 已经展示了 ChatGPT 的语音功能,不过当时该功能仅限于 iOS 和 Android 应用。此次推出的高级语音模式基于最新的 GPT-4o 模型,具备原生音频处理能力,能够与用户进行自然语言交流。此外,该模式还能识别语调和语速等非语言信号,并在回应时模仿情绪,使互动更加生动真实。
对于已经订阅付费计划的用户,只需点击提示窗口右下角的语音图标,即可在网页版上启用高级语音模式。需要注意的是,Plus 和 Teams 用户每天使用语音模式的次数有限制,达到上限时系统会发出提醒。
威尔还表示,OpenAI 正在优化语音模式的交互方式,以减少用户的“被打断感”。在此之前,建议用户在开口前先整理好自己的思路。据 IT 之家报道,这一备受期待的功能最早于今年 7 月向测试用户开放,9 月底开始向付费订阅用户推广。OpenAI 在 10 月的一条推文中提到,免费用户也将有机会体验高级语音模式,但欧盟地区的 Plus 和 Free 用户可能需要稍作等待。