当地时间周一,OpenAI 正式向用户开放了其最新的人工智能视频生成模型 Sora。该系统能够根据文本提示生成逼真的视频内容,这距离首次公开预览这款产品已经过去近一年的时间。
根据 OpenAI 的介绍,Sora 将于当天晚些时候向美国及其他市场的 ChatGPT 付费用户开放。新版工具 Sora Turbo 能够生成最长20秒的视频,并提供多种变体供用户选择。
自今年2月首次预告 Sora 以来,OpenAI 已经与多家电影制片厂、媒体高管及经纪公司进行了交流。此外,OpenAI 还邀请了一些艺术家、知名演员和导演来试用该服务。
OpenAI 表示,Sora 是一种基础性的 AI 技术,能够理解和模拟现实世界。这项技术对于开发能够与物理世界互动的模型至关重要。不过,Sora 在早期测试中也显现出一些局限性。例如,在某些情况下,Sora 生成的视频会出现“多余肢体”的问题,对物理现象的理解也不够精确。此外,与图像生成器或聊天机器人相比,Sora 在生成每个视频时所需的算力和时间要多得多。
OpenAI 首席执行官表示,初期 Sora 的使用仍然有限制。ChatGPT Plus 订阅用户每月可以生成50个低分辨率视频,而 ChatGPT Pro 订阅用户则可以无限制地生成高分辨率视频(最高分辨率为1080p,最长20秒),并且可以同时生成五个视频,视频还可以无水印下载。
Sora 最令人印象深刻的特点之一是它能够逼真地模拟物理世界,这被 OpenAI 称为“新兴的模拟能力”。在此之前,没有任何文字视频模型能够达到这一水平。例如,Sora 能够在一个生成的视频中创建多个镜头,并准确地表现人物和视觉风格。它可以制作长达1分钟的视频,但用户也可以根据需要制作更短的视频。Sora 支持不同分辨率的竖版、方形和水平视频,计算量越大,视频质量也会越高。
有评论指出,本周一上线的 Sora 类似于 OpenAI 的图像生成工具 DALL-E。用户只需输入期望的场景,Sora 将会生成相应的高清视频剪辑。
Sora 页面上介绍了一些功能,其中包括名为 Remix 的重新混合功能。这个功能可以让用户替换、删除或重新构想视频中的元素。例如,用户可以设计一个打开大门通向图书馆的场景,然后用法式对开门替换普通的大门,还可以把图书馆变成一艘宇宙飞船,再移除宇宙飞船,添加一片丛林,甚至用月球景观代替丛林。
Sora 还包括一个名为 Storyboard 的选项,用户可以通过它详细描述希望视频在不同时间点发生的内容,从而更好地指导一系列片段的生成。此外,Sora 还提供了一个功能,让用户可以浏览其他人创作的视频集锦。
Sora 的发布是 OpenAI 为期12天的产品直播活动的一部分。上周,OpenAI 已经推出了更昂贵的 ChatGPT Pro 订阅选项,该选项提供了无限制访问 OpenAI 最强大的 AI 模型。
在定价方面,Sora 目前包含在 OpenAI 的两个产品套餐中。ChatGPT Plus 每月收费20美元,为订阅用户生成的视频分辨率达到720p,时长最长5秒。ChatGPT Pro 每月收费200美元,订阅用户可以无限制生成高分辨率视频(分辨率达到1080p,最长时长20秒),并且可以同时生成五个视频,视频可以无水印下载。