2025年被视为AI视频商业化的起点,众多布局多模态领域的公司正加速推进技术研发和商业化的进程。在此背景下,专注于多模态大模型的生数科技宣布了一项重要的人事调整。
消息显示,曾负责火山引擎AI应用产品线的骆怡航近期正式入职生数科技,担任首席执行官(CEO),全面负责公司的研发、产品开发、商业运营以及团队建设。根据相关数据,原CEO唐渝仍持有生数科技的控股权,占比19.5653%。
骆怡航出任生数科技CEO
成立于2023年3月的生数科技,致力于多模态大模型的技术创新,其核心团队大多来自清华大学人工智能研究院。骆怡航同样出身“清华系”,他毕业于清华大学自动化系,在云计算和AI领域深耕多年。在加入生数科技之前,骆怡航是字节跳动火山引擎AI应用产品线的负责人,领导该部门的战略规划、产品研发和商业拓展。
骆怡航一手打造了火山引擎AI应用产品线,涵盖了多个AI技术和大模型的应用场景,团队规模达数百人,服务于全球数万家企业客户。他还曾在字节跳动主导AI解决方案的设计与合作,参与构建了公司的AI中台,见证了字节跳动在AI领域的成长。
“无论是开创全新AI项目,还是扩展国际市场,骆怡航都展现了出色的综合能力。”业内人士如此评价。他的到来,被认为能助力生数科技加快技术应用的步伐,探索更多行业场景,并深化Vidu在影视、动漫、广告、教育、游戏、旅游等领域的实践。此外,生数科技也将进入规模化和国际化的加速阶段,而骆怡航的管理经验将帮助公司优化组织架构,增强团队实力,并制定更具远见的发展计划。
为了进一步推动全球市场的布局,生数科技还引进了多位资深管理人员,包括负责商业化的副总裁王川和品牌市场负责人刘婷婷。
“中国版Sora”加速商业化
骆怡航的加入可能标志着生数科技从技术攻关转向商业化推广的战略转变。2024年4月,生数科技推出了视频大模型Vidu,这款工具能够快速生成高质量视频,不仅能够还原真实场景,还能展现丰富的创意元素。得益于独特的U-ViT架构,Vidu在性能上与知名模型Sora的DiT架构异曲同工,因此被誉为“中国版Sora”。
值得注意的是,尽管Vidu借鉴了Sora的Diffusion Transformer架构,但其核心技术完全源自生数科技的自主研究,且发布时间早于Sora的底层架构。早在2022年9月,生数科技便推出了参数量达9.5亿的U-ViT网络架构,这是全球首个Diffusion Transformer架构。随后,伯克利的研究团队才发布了类似的U-Net架构。
2025年初,生数科技发布了Vidu2.0版本,能够在极短时间内生成清晰的短视频片段,每秒的成本仅为行业平均水平的一半。这种突破显著降低了用户的使用门槛。
自成立以来,生数科技已完成多轮融资,最近一次是在2024年6月,获得了北京市人工智能产业投资基金和百度的共同领投,其他投资方还包括中关村科学城公司、启明创投等。
生数科技的商业模式主要分为两种:一是通过订阅服务提供产品功能(SaaS模式),二是以API的形式输出模型能力(MaaS模式)。这样的设计旨在满足不同客户的实际需求。
尽管Vidu在技术上处于领先地位,但生数科技仍需应对模型同质化、高算力投入以及市场需求匹配等方面的挑战。对此,知情人士认为,骆怡航的加入表明AI视频生成领域已经进入技术成熟和商业化的关键时期。