谷歌发布 AI 图像生成新工具 Whisk,支持上传多张图片以图生图

图灵汇官网

谷歌近日推出了一款名为 Whisk 的全新 AI 图像生成工具。这款工具让用户能够通过上传图像来生成新的图像,而无需撰写冗长的文字描述。用户只需上传一张或多张图片,就能指导 AI 生成符合特定主题、场景和风格的图像。

使用 Whisk 时,用户可以上传多张图片来分别设定主题、场景和风格。当然,用户也可以选择使用文字描述。若没有合适的参考图片,用户还可以点击骰子图标,让谷歌自动生成一些图片作为提示。此外,用户可以在生成过程的最后阶段添加一些文字说明,以便更详细地描述所期望的图像效果,但这一步并不是强制性的。

Whisk 生成图像后,还会为每张图像生成相应的文字提示。如果用户对生成结果感到满意,可以选择收藏或下载;如果有需要进一步调整的地方,可以通过添加更多的文字描述或编辑现有的文字提示来进行优化。

谷歌表示,Whisk 是基于公司最新的 Imagen 3 图像生成模型开发的,该模型也在今天正式发布。谷歌在官方博客中指出,Whisk 主要是为了实现快速的视觉探索,而不是进行像素级别的精细编辑。由于可能会出现一些偏差,用户被赋予了编辑底层提示的权限。

体验者反馈称,尽管 Whisk 在使用过程中偶尔会产生一些奇怪的结果,但整体上带来了有趣且易于修改的体验。图像生成过程大约需要几秒钟时间,生成的图像内容都相对容易进行后续的调整和改进。

本文来源: 图灵汇 文章作者: 蔡慧娟
    下一篇

IT之家 12 月 17 日消息,据《智能涌现》今日报道,AI 独角兽“智谱”近期完成新一轮融资,金额为 30 亿元。新投资方包括多家战投及国资,君联资本等老股东继续跟投。报道称,本轮融资将用于智谱基