攻破AI视频大模型训练挑战!火山引擎送上“神助攻”,方案已应用于豆包,披露视频云出海全景图

图灵汇官网

导读

火山引擎发布了大模型训练视频预处理方案,旨在解决视频大模型训练的成本、质量和性能问题。此外,火山引擎还推出了一系列AI视频解决方案,覆盖视频生产、交互和消费的各个环节。

大模型训练视频预处理方案

火山引擎发布了大模型训练视频预处理方案,旨在解决视频大模型训练中的成本、质量和性能问题。该方案已在豆包视频生成模型中得到应用,实现了大规模扩散生成模型和高压缩比高还原性视频编码解码模型等核心技术。

AI视频解决方案

除了视频预处理方案,火山引擎还推出了多项AI视频解决方案,包括跨语言同声复刻直播方案、多模态视频理解与生成方案、对话式AI实时交互方案和AIG3D大场景重建方案。这些方案涵盖了视频生产、交互和消费的全链路,旨在提升用户体验。

视频编解码芯片

火山引擎自研的视频编解码芯片已在抖音集团内部实践验证,实现了效率显著提升和成本大幅降低。该芯片将于近期对外开放测试,招募首批种子用户,共同探索商业价值的可复制性。

AI视频时代的挑战

火山引擎视频云基于抖音的真实业务实践和行业客户的共创,积极探索大模型AI与视频技术的深度融合。在技术底座层面,火山引擎依靠自研的算力编解码技术和多媒体处理框架,致力于优化成本并提升计算效率。在处理链路层面,结合大模型和AI技术,全面优化了生产交互和消费链路,以打造更智能、更交互、更沉浸的用户体验。

自研芯片对外开测

抖音集团视频架构负责人王悦分享了一组数据,指出视频是云业务中增长最快的工作负载之一。火山引擎去年推出的自研视频编解码芯片在抖音集团内部实践验证中实现了效率的显著提升和成本的大幅降低。该芯片将于近期正式对外开放测试,招募首批种子用户,共同探索商业价值的可复制性。

多模态视频处理框架

火山引擎自研视频处理框架BMF自去年开源以来,在助力AI初创项目落地和移动端开源层面不断演进。BMF lite版本进一步发布并开源,具有更轻量、更通用、更高效的特点,支持端侧大模型接入和算子加速、算法间复用资源。目前BMF lite已广泛应用于抖音各业务,每天服务超过10亿用户。

视频生成大模型

豆包视频生成模型PixelDance采用了火山引擎的大模型训练视频预处理方案,充分利用了大量潮汐资源,为模型训练提供了有力支撑。PixelDance 1.4版本具备四大特点:生成复杂连续动作、复杂的多主体交互、多镜头视频和超强的运镜控制能力。

全链路AI能力

火山引擎发布了多项AI视频解决方案,涵盖视频生产、交互和消费的全链路。在生产端,跨语言同声复刻直播方案优化了同传直播,实现了精准的字幕识别和自然断句。在交互端,对话式AI实时交互方案提升了人与AI的自然交互能力。在消费端,AIG3D方案和大场景重建方案提供了更真实的沉浸体验。

AI赋能业务增长

AI新产能助力业务增长的关键在于创建新场景、制造新体验和塑造新产能。AI智能体提升了直播间的变现效率,生成式AI降低了创作门槛,带动了内容量级的增长。AI创作工具促进了视频投稿量和内容丰富度的有效增长。

结语

AI与视频技术的深度融合正在推动用户体验的多维度转变。火山引擎致力于优化多媒体处理框架的部署,提升计算效率,推动编解码与智能技术的更好融合,从而提升最终的体验效果。

本文来源: 互联网 文章作者:
    下一篇

导读:近日,首款生成式AI发现和设计的药物得到临床疗效验证。一款来自AI制药公司英矽智能的TNIK抑制剂ISM001-055在IIa期临床试验中取得了积极的初步研究结果。在特发性肺纤维化(IPF)这一