对话生数科技CEO唐家渝：AI视频到了“普及”节点提升时长不是产品化的重点

投稿
APP
微信扫一扫获取更多

对话生数科技CEO唐家渝：AI视频到了“普及”节点提升时长不是产品化的重点

索蓝商服

2024-09-13 13:28:29

图灵汇官网

标题： 生数科技发布创新功能，破解视频模型生成主体一致性难题

导语： 9月11日，生数科技举办媒体开放日活动，宣布推出“主体参照”功能，旨在解决视频模型生成中的主体一致性问题。此次活动上，生数科技联合创始人兼CEO唐家渝分享了公司对于商业模式的见解，指出在AI视频领域，B端市场目前占据优势，而C端市场增长迅速。

正文：

功能发布：生数科技在媒体开放日活动中，发布了一项名为“主体参照”的创新功能，旨在解决视频模型生成时主体一致性方面的挑战。
商业模式讨论：在回应《每日经济新闻》记者关于商业模式的问题时，唐家渝表示，生数科技采用SaaS订阅和MaaS（模型即服务）两种商业模式，其中，自7月30日Vidu上线以来，全球已收到数千个API接入申请。
底层架构分析：唐家渝透露，旗下产品Vidu使用的“U-ViT架构”与Sora所用的“DiT架构”极为相似，两者均结合了Diffusion和Transformer技术，但在设计上，U-ViT更加注重落地应用，使其在相同时间内所需的计算资源更少。
同质化与差异性：唐家渝指出，尽管在底层架构上存在相似性，但各家在技术进展和能力方面有所不同。以语言模型为例，尽管都基于Transformer架构，但OpenAI仍处于领先地位，这表明在该架构基础上仍有许多技术环节需要深入研究。
目标与战略：生数科技致力于打造通用大模型，视视频生成为其多模态生成大模型发展过程中的一个阶段。公司不仅在视频领域有所布局，还涉足其他模态的生成能力。
市场分析：从收入角度看，B端市场在现阶段贡献了更多的收益，但C端市场增长迅速，尤其是自Vidu上线以来。B端市场的需求明确且稳定，是公司的长期重点发展方向，而C端市场则在不断探索中。
行业展望：尽管国内视频生成模型和工具表现出色，但唐家渝认为，国内外头部玩家均处于第一梯队，国内尚未完全领先。
AI视频的普及趋势：AI视频技术正逐步进入普及阶段，尤其是在影视、动漫等行业，降低了创作者门槛。生数科技通过发布“主体参照”功能，旨在进一步降低创作门槛或加速创作过程。
技术与商业的平衡：在AI视频领域，技术的原创性和突破性与商业化的同步发展至关重要。尽管当前视频生成技术在物理规律的模拟上已有显著进步，但仍需不断提升模型能力，特别是在复杂场景和动态化场景的表现上。
模型能力的持续提升：尽管当前Vidu最长可生成32秒的视频，但生数科技计划进一步扩展生成时长。从实用角度来看，当前公司更侧重于提升模型的实用性，而非单纯追求时长的增加。