可灵AI上线“多图参考”模式可一键生成多主体融合视频

投稿
APP
微信扫一扫获取更多

可灵AI上线“多图参考”模式可一键生成多主体融合视频

天龙

2025-02-06 20:44:13

图灵汇官网

近日，快手可灵AI推出了全新的“多图参考”模式，这一功能能够理解和整合多张图片中的不同主体，并根据用户的文字描述，创造性地生成融合视频，从而有效解决了AI视频生成中的一致性难题。

用户可以在可灵1.6模型下体验这一功能。只需选择图生视频选项，上传1到4张参考图，然后框选出图片中需要使用的对象（如人物、动物、物品或场景），并通过“提示词”描述这些对象的变化或互动，可灵AI便能结合所有参考内容并按照指令生成视频。

用户可以上传一张或多张同一主体（如人物、动物、影视角色或物品等）的图片，模型会依据这些图片生成统一风格的视频，帮助用户在制作AI视频时保持多镜头中的主体一致性。例如，用户上传了一张猫、一件夹克和一副太阳镜的图片，并输入提示词“一只穿着夹克、戴着太阳镜的拟人化猫在舞台上转身并对着镜头摆姿势”，随后生成的视频就会符合这一指令。

此外，用户还可以利用参考图来指定场景、服装和动作等，使人物在特定环境中完成特定“演出”，大大提高了创作的可控性。例如，上传一位卡通风格的老爷爷、一杯咖啡以及咖啡馆场景的图片，并输入提示词“一位卡通风格的老爷爷在咖啡馆里端起咖啡杯”，这样就能生成老爷爷坐在咖啡馆里喝咖啡的视频。

“多图参考”还支持不同角色之间的互动。用户可以上传多张人物、动物或影视角色的图片，并通过文字描述他们之间的互动。例如，上传一张小男孩和一只柯基犬的图片，并输入提示词“一个可爱的小男孩在抚摸一只柯基犬”，就能生成相应的视频。

在此之前，可灵AI已经在全球范围内推出了“人脸模型”功能，允许用户通过上传多段视频来训练、定制人脸模型，并以此为基础继续生成视频内容。作为行业内的首创，这一功能满足了用户创作多个包含同一人物镜头的需求。

随着“多图参考”功能的推出，可灵AI进一步提升了视频生成的一致性，帮助用户更好地发挥创造力，自由组合各种图片元素，创造独特的创意场景，探索更多可能性。