谷歌近日推出了一款名为 Whisk 的全新 AI 图像生成工具。这款工具让用户能够通过上传图像来生成新的图像,而无需撰写冗长的文字描述。用户只需上传一张或多张图片,就能指导 AI 生成符合特定主题、场景和风格的图像。
使用 Whisk 时,用户可以上传多张图片来分别设定主题、场景和风格。当然,用户也可以选择使用文字描述。若没有合适的参考图片,用户还可以点击骰子图标,让谷歌自动生成一些图片作为提示。此外,用户可以在生成过程的最后阶段添加一些文字说明,以便更详细地描述所期望的图像效果,但这一步并不是强制性的。
Whisk 生成图像后,还会为每张图像生成相应的文字提示。如果用户对生成结果感到满意,可以选择收藏或下载;如果有需要进一步调整的地方,可以通过添加更多的文字描述或编辑现有的文字提示来进行优化。
谷歌表示,Whisk 是基于公司最新的 Imagen 3 图像生成模型开发的,该模型也在今天正式发布。谷歌在官方博客中指出,Whisk 主要是为了实现快速的视觉探索,而不是进行像素级别的精细编辑。由于可能会出现一些偏差,用户被赋予了编辑底层提示的权限。
体验者反馈称,尽管 Whisk 在使用过程中偶尔会产生一些奇怪的结果,但整体上带来了有趣且易于修改的体验。图像生成过程大约需要几秒钟时间,生成的图像内容都相对容易进行后续的调整和改进。