标题: 生数科技发布创新功能,破解视频模型生成主体一致性难题
导语: 9月11日,生数科技举办媒体开放日活动,宣布推出“主体参照”功能,旨在解决视频模型生成中的主体一致性问题。此次活动上,生数科技联合创始人兼CEO唐家渝分享了公司对于商业模式的见解,指出在AI视频领域,B端市场目前占据优势,而C端市场增长迅速。
正文:
功能发布:生数科技在媒体开放日活动中,发布了一项名为“主体参照”的创新功能,旨在解决视频模型生成时主体一致性方面的挑战。
商业模式讨论:在回应《每日经济新闻》记者关于商业模式的问题时,唐家渝表示,生数科技采用SaaS订阅和MaaS(模型即服务)两种商业模式,其中,自7月30日Vidu上线以来,全球已收到数千个API接入申请。
底层架构分析:唐家渝透露,旗下产品Vidu使用的“U-ViT架构”与Sora所用的“DiT架构”极为相似,两者均结合了Diffusion和Transformer技术,但在设计上,U-ViT更加注重落地应用,使其在相同时间内所需的计算资源更少。
同质化与差异性:唐家渝指出,尽管在底层架构上存在相似性,但各家在技术进展和能力方面有所不同。以语言模型为例,尽管都基于Transformer架构,但OpenAI仍处于领先地位,这表明在该架构基础上仍有许多技术环节需要深入研究。
目标与战略:生数科技致力于打造通用大模型,视视频生成为其多模态生成大模型发展过程中的一个阶段。公司不仅在视频领域有所布局,还涉足其他模态的生成能力。
市场分析:从收入角度看,B端市场在现阶段贡献了更多的收益,但C端市场增长迅速,尤其是自Vidu上线以来。B端市场的需求明确且稳定,是公司的长期重点发展方向,而C端市场则在不断探索中。
行业展望:尽管国内视频生成模型和工具表现出色,但唐家渝认为,国内外头部玩家均处于第一梯队,国内尚未完全领先。
AI视频的普及趋势:AI视频技术正逐步进入普及阶段,尤其是在影视、动漫等行业,降低了创作者门槛。生数科技通过发布“主体参照”功能,旨在进一步降低创作门槛或加速创作过程。
技术与商业的平衡:在AI视频领域,技术的原创性和突破性与商业化的同步发展至关重要。尽管当前视频生成技术在物理规律的模拟上已有显著进步,但仍需不断提升模型能力,特别是在复杂场景和动态化场景的表现上。
模型能力的持续提升:尽管当前Vidu最长可生成32秒的视频,但生数科技计划进一步扩展生成时长。从实用角度来看,当前公司更侧重于提升模型的实用性,而非单纯追求时长的增加。
结语:随着AI技术的不断演进,生数科技持续探索和优化其产品功能,旨在为用户提供更高效、更便捷的视频生成解决方案,推动AI视频技术的广泛应用和发展。