OpenAI近日展示了全新的AI工具Sora,只需提供简单的文本描述,Sora便能生成长达60秒的视频。Sora的研发灵感源自图像生成工具DALL-E,它能够解析文本提示,将其转化为一系列指令,再利用AI模型生成新视频。
尽管市场上已有诸如谷歌的Lumiere、Meta的Emu以及AI创业公司Runway开发的工具,但Sora在视频质量上明显更胜一筹。此前,许多专家预计此类工具还需2-3年才能问世,而Sora的出现显然超出了预期。它不仅能生成连贯且有序的视频,还能在质量和功能上超越现有的“文本-视频”工具。
例如,巴基斯坦前总理伊姆兰·汗曾使用AI技术制作了一段视频,向支持者发表演讲。同样,佛罗里达州州长罗恩·德桑蒂斯也曾借助AI音频生成器模仿前总统特朗普的讲话。这些实例表明,AI技术在各个领域的应用日益广泛。
Sora对无人驾驶的影响
近年来,无人驾驶技术的发展一直备受关注。2015年,谷歌无人驾驶项目的负责人克里斯·厄姆森曾表示,他的目标是开发出真正的无人驾驶汽车,让11岁的孩子无需考驾照。然而,直到2024年,这项技术仍未实现。与此同时,百度高管王劲也曾承诺在2020年前推出无人驾驶汽车,但最终未能如愿。
如今,无人驾驶技术的发展似乎陷入了停滞,Waymo、特斯拉等公司在这一领域显得较为沉寂,而华为的无人驾驶技术则给人带来一些希望,但距离广泛应用仍有距离。
就在不久前,Waymo首次宣布召回其无人驾驶汽车,原因是软件存在漏洞导致了两起事故。这一事件引发了对无人驾驶技术可靠性的质疑,而核心问题在于当前的AI技术还不够成熟。
Sora的潜力
Sora的出现被认为具有里程碑意义,它不仅能够深入理解文本提示,还能生成高质量的视频场景。Sora可以模拟多种多样的场景,包括野生动物、风景、动画等,未来在娱乐、教育、无人驾驶等领域都有广阔的应用前景。
Sora不仅能生成短视频,还能学习现实世界的物理规律并进行扩展。它可以预测场景中物体的运动轨迹,这些能力对于无人驾驶技术来说至关重要。奇虎360的创始人周鸿祎认为,Sora对物理世界的模拟将对机器人和自动驾驶技术产生重大影响。他认为,Sora的出现使得实现通用人工智能(AGI)的时间可能会从10年缩短到一两年。
OpenAI创始人山姆·阿尔特曼也表达了类似的观点,他认为人类级别的AI即将来临。不过,他也指出,目前的AI还只是一种高效的辅助工具,尚未达到全面替代人类工作的程度。
然而,Meta首席AI科学家扬·勒库恩对此持谨慎态度。他认为,现有的AI系统仍存在诸多缺陷,无法真正理解世界,也无法达到人类的推理水平。他强调,要实现真正的AGI,还需要跨越多个智力门槛。
总结
Sora无疑为AI技术的进步注入了新的活力,尽管距离真正的AGI还有一定距离,但它已经展示了巨大的潜力。未来,随着技术的不断发展,无人驾驶技术有望实现质的飞跃。尽管人们对AGI的实现时间存在不同的看法,但可以肯定的是,迈向AGI是人类科技发展的必然选择。