别等Sora了!这些国产AI视频大模型,款款都超能打

图灵汇官网

导读:

Sora已经到来,但并非全面开放。在为期12天的发布会活动的第三天,OpenAI正式向公众发布了AI视频大模型Sora Turbo,最高支持生成20秒视频,仅为最初宣布时宣传时长的三分之一。更为重要的是,目前只有少数用户能够体验Sora Turbo,该应用仍在测试阶段。

在此之前,海外已有其他公司开发出视频大模型,但直到今年2月Sora首次亮相,视频大模型行业才真正进入快速发展期。然而,Sora虽然推动了视频大模型的发展,但它似乎已经落后。

在国内市场,已有超过二十款AI视频大模型涌现,包括腾讯、阿里巴巴和字节跳动在内的互联网巨头也纷纷推出自己的视频大模型。从行业角度来看,视频大模型使机器能够理解和重构真实世界;从用户角度看,这些模型极大地激发了人们的创造力。

与通用语言模型不同,视频大模型的应用场景更加专业,因此现阶段大部分都需要付费使用。免费用户只能获得少量积分或每天有限次数的视频生成机会,且可能无法体验高级功能。因此,许多用户可能不了解国内有哪些视频大模型。

接下来,本文将介绍六款国内知名的AI大模型,并分析其功能特点。或许在未来,这些模型将成为你将创意变为现实的工具。

国产视频大模型的竞争

Sora发布后,快手科技的AI团队迅速推出了可灵,如今已升级至1.5版本。小雷认为,可灵是国内众多视频大模型中体验最好的几款之一。它支持两种模式:文生视频和图生视频,并允许用户调整创意水平和相关性。免费用户可以使用文生视频功能生成最长5秒的高清视频,或者使用图生视频功能生成最长10秒的标准视频。小雷使用描述语生成了一段视频,细节非常丰富,但生成的结果是在白天,而非描述的夜晚。

即梦:语言解析能力强,但缺乏灵动性

快手推出可灵后,抖音不甘落后,推出了即梦。除了文生视频和图生视频功能外,即梦还增加了对口型功能。即梦已更新至多个版本,但需要积分才能使用。小雷使用相同的描述语生成了一段视频,质量也不错,但猫咪的动作显得过于机械,缺乏灵动性。

混元:功能有待丰富,潜力巨大

腾讯最近推出了混元视频大模型,仅支持文生视频,每日免费生成次数有限。小雷生成的视频质量较低,细节不足。不过,作为互联网巨头腾讯的产品,混元有望在未来通过迭代升级,达到与其他优秀模型相媲美的水平。

Vidu:功能丰富,运镜自然

Vidu由北京数生科技与清华大学联合开发,支持文生视频和图生视频,并支持生成具有立体感的画面。小雷生成的视频质量很高,细节丰富,运镜自然流畅。唯一的缺点是沙滩质感不足。

清影:功能丰富,但理解能力有待提升

清影是清华大学计算机系知识工程研究室团队开发的模型,功能丰富,支持文生视频和图生视频。小雷生成的视频质量不佳,画面几乎看不出是视频。与Vidu相比,清影在理解自然语言方面仍有改进空间。

PixVerse:画面唯美,但动作僵硬

PixVerse由爱诗科技开发,功能丰富,支持多种设置和调整。小雷生成的视频画面唯美,但猫咪的动作显得过于僵硬。尽管存在这些问题,PixVerse的表现仍然出色。

细节决定成败

国内AI企业在视频大模型领域已经迈出重要一步,但仍需不断完善。小雷体验的可灵、即梦、Vidu和PixVerse表现最佳,腾讯混元位列第二梯队,清影则在第三梯队。尽管这些模型各有优劣,但细节方面的改进仍是关键。AI视频大模型需要更好地理解自然语言,提高画面细节和运镜质量,才能真正成为用户的创作助手。此外,高昂的价格限制了付费用户的数量,许多AI视频大模型公司需要寻找盈利点,以应对激烈的市场竞争。

本文来源: 互联网 文章作者: 江城雪
    下一篇

导读:导读THECAPITALAI大模型深度分析报告,展示AI在内容获取、创作、交互及行业场景的应用前景。本文4689字,约5.4分钟作者 | 融中咨询来源 | 融中咨询(ID:gh_fdc07527