施展魔法
我们认为,不应该让用户为了生成图片而“学习如何给出提示”。工具应该简单易用,让用户能够直观轻松地尝试、不断调整、优化和重新组合创意,就像在与朋友分享自己的奇思妙想一样。因此,我们正在尝试一些新的东西!
Whisk 是 labs.google/fx 最新的生成式媒体实验,专注于帮助用户快速进行视觉构思,而无需深入理解如何给出提示!
只需上传几张图片作为简单指引(场景、主体、风格),Whisk 就会尝试捕捉它们的精髓,并生成一些图片供您继续构思。您可以浏览我们的图库以获取灵感,选择您想要重新制作的图片,然后加入自己的创意!
Gemini 模型会在后台自动为图片编写详细的图片说明,然后将这些说明输入到 Google 最新的图片生成模型中。
无论是将一幅画变成毛绒玩具、制作一张精美的节日贺卡,还是以图像形式描绘故事开头…我们都很期待看到您运用 Whisk 创作的内容。
借助 Whisk Animate,您可以通过 Veo 2 将生成的图片转换为短视频。为了帮助您上手,G1 支持的国家/地区的 Whisk 用户每月可以免费生成 10 个视频!请注意,此限额每月都会重置。
如果您想制作更多视频,可以订阅 Google AI Pro 或 Ultra,从而获得更高的生成数量上限。与免费层级类似,这些订阅者的点数也会每月重置。订阅之后,每月视频生成数量中将包括 10 个免费视频。
准备
将一些图像元素交给 Whisk 分析和组合。您可以直接拖放图片、从文件夹中上传图片,或者输入文字提供一些简单的描述,也可以选择“给我灵感”或“掷骰子”功能,让我们为您提供一些创意灵感。
幕后揭秘:Gemini 会对这些素材资源进行视觉理解并生成图片说明,而这些说明是 Whisk 用于创作的基础。您可以随时点击“修改”查看这些说明是否正确,让结果更贴近您的想法!
探索
混搭就要开始了!您可以挑选素材资源,这包括一个或多个主体、一个场景和一种风格。Whisk 收到后,会将它们融合创作出别具一格的作品。
看看 Whisk 能生成什么,然后我们继续发挥!您也可以补充一些简单的指令,打磨一下细节,让想象力自由驰骋。
“让角色舔个冰淇淋”
“让恐龙和猫咪击个掌!”
“确保珐琅胸针是圆形的。”
“配色方案改为柔和色调”
幕后揭秘:Gemini 会将图片说明和您的指令组合生成提示。您可以点击“修改”,看看 Gemini 对图片模型“说”了什么。
优化
觉得图片还不错,但帽子想换成蓝色的?或者想在背景里挂上夕阳?您可以进入“优化”模式,要求系统在原风格的基础上进行中小幅改动。
幕后揭秘:Gemini 会根据您的指令更新提示!然后再让模型根据提示重新生成画面,同时尽可能保持原来的样子。
诊断
说实话,结果可能会出人意料!或许某些元素被遗漏了?或许无法生成您想要的图片?
在上述任何阶段,您都可以通过点击提示按钮/图标来查看和修改底层提示,手动添加关键细节,让模型生成更多图片供您选择。主控权始终在您手中 :-)
分享
喜欢最终的作品?快生成分享卡片,邀请好友玩创意混搭!点击工具中图片上的分享图标,即可生成公开链接。
主体
主体是图片中的重点内容。它可以是角色、物体,或二者兼具。例如,可以是一部老式拨号盘电话、一把酷炫的椅子、一个纸质电影立牌、一个神秘的文艺复兴吸血鬼!您也可以提供自己的照片作为参考依据,看看会生成怎样的图片 :-)
场景
场景是主体出现的地方。它可以是时装秀 T 台,也可以是立体弹出式节日贺卡。您可以将新角色带入场景中,放在现有角色旁边,或者将现有角色替换掉,试试看效果如何。
风格
如果您想就主体和场景采用的美学形式、材质或表现技巧提供更多指引,请选择“风格”。例如,可在主提示框中指定您最关心的内容,让指引更加明确。
您可以使用自然语言添加更多细节(例如,“主体正在享用生日晚餐”),Whisk 会尝试将这些细节融入图片中。
为了将不同图片中的元素重新组合在一起,我们首先需要了解您上传的每张图片。这时候 Gemini 的多模态理解功能就派上用场了!您上传图片后,Whisk 会使用 Gemini 对图片进行视觉理解,并生成关于图片的文本描述或图片说明。换句话说,将图片转换成文本 (I2T)。这些描述旨在捕捉所参考图片的精髓,而非复制原始内容,以便于重新合成创意。
然后,系统会使用这些图片说明编写一个详细的提示,以便使用我们最新且功能最强大的图片生成模型 Imagen 3,根据您的指引生成一张图片。换句话说,将文本再转换回图片 (T2I)。
借助 Whisk Animate,您可以为 Whisk 生成的图片指定动作指引,从而通过 Veo 2 将相应图片转换为短视频。
上述过程有助于 Whisk 更好地理解和呈现您正在构思的创意,并在与您对话的过程中对生成的结果不断进行调整。
输出内容只会与您上传的内容相似,而不会完全相同。在我们的实验中,Whisk 仅从您提供的图片中提取少数几个关键特征来为模型提供指引。我们的目标不是创作与原图完全相同的复制品,而是把握主体的精髓。
因此,生成的图片在外观上可能与原图不同。例如,生成的主体可能身高体重不一样,或者具有不同的发型或肤色。我们知道,这些特征对角色的独特性来说可能很关键。因此,为了得到更接近您设想的结果,建议您提供更详细的提示,并优化指令。
您可以使用右上角的菜单向我们发送反馈。
我们正在努力尽可能将我们的工具推向更多用户。除英国外,Whisk 适用于 labs.google/fx 支持的所有国家/地区年满 18 周岁的用户。
借助 Whisk Animate,您可以为 Whisk 生成的图片指定动作指引,并通过 Veo 2 将图片转换为短视频。
Whisk Animate 已在以下国家/地区推出:美属萨摩亚、安哥拉、安提瓜和巴布达、阿根廷、澳大利亚、巴哈马、伯利兹、贝宁、玻利维亚、博茨瓦纳、巴西、布基纳法索、佛得角、柬埔寨、喀麦隆、加拿大、智利、科特迪瓦、哥伦比亚、哥斯达黎加、多米尼加共和国、厄瓜多尔、萨尔瓦多、斐济、加蓬、加纳、关岛、危地马拉、洪都拉斯、牙买加、日本、肯尼亚、老挝、马来西亚、马里、毛里求斯、墨西哥、莫桑比克、纳米比亚、尼泊尔、新西兰、尼加拉瓜、尼日尔、尼日利亚、北马里亚纳群岛、巴基斯坦、帕劳、巴拿马、巴布亚新几内亚、巴拉圭、秘鲁、菲律宾、波多黎各、卢旺达、塞内加尔、塞舌尔、塞拉利昂、新加坡、南非、韩国、斯里兰卡、坦桑尼亚、汤加、特立尼达和多巴哥、土耳其、美属维尔京群岛、乌干达、美国、乌拉圭、委内瑞拉、赞比亚和津巴布韦。
请在 Whisk 图库中寻找灵感!探索各种 Whisk 创作的新构思,选择您喜欢的内容,然后点击“自定义”,即可合成一幅全新作品。
可以,点击下载图标即可保存并分享或生成分享链接。我们也想看看您创作的内容,欢迎通过
Discord 频道与我们分享!
分享链接将显示:
- 作品的配方。
- 作品的独立图片。
- (可选)作品中使用的素材(素材资源)。
可以。默认情况下,分享时会包含您作品中使用的素材(素材资源)。不过,您可以选择在生成分享链接时隐藏这些素材。
知道分享链接的任何人都可以查看您的作品。无法限制特定账号的访问权限。
用户点击分享链接时,您的作品会直接加载到该用户的工具中。这样,此用户就可以查看该作品并开始重新合成自己的版本。
- 如果您删除分享的图片:分享链接将不再显示该图片,而是会显示一条消息,告知内容已不再可用。
- 如果您删除所分享作品中的某项素材资源(素材):分享链接仍会加载,但会缺少这项特定素材资源。
- 重要说明:如果在您删除某项素材资源之前,另一位用户已对您分享的图片进行了重新合成,那么此人将拥有该素材资源的副本。删除原始素材资源不会将其从该用户的重新合成版本中移除。
可以,您可以通过 Whisk 页面顶部的“我的库”链接访问以前生成的内容。或者,您也可以前往
https://labs.google/fx/library,在产品下拉列表中选择 Whisk,查看以前生成的内容。在这里,您可以修改项目标题,还可以删除项目或项目中的特定资源。删除项目会删除与之关联的所有资源。项目会自动保存,并且在一个会话中创建的所有资源都会分到同一项目中。
《服务条款》中规定了 Whisk 的使用方式,您必须完整查阅并遵守这些条款。根据这些条款:我们的部分服务允许您生成原创内容。Google 不会对这类内容声明所有权。
在 Whisk 中使用 Veo 和 Imagen 生成的所有输出内容都包含不可见的 SynthID 水印。SynthID 会直接在 AI 生成的内容中嵌入数字水印,从而标识 AI 生成的内容。
为了帮助用户识别 AI 生成的内容,我们还采取了额外措施:在 Whisk Animate 中生成的视频会包含一个可见的水印,指明该内容是使用 Veo 制作的。
若要了解用户数据、用户历史记录、我们的生成式工具政策、如何发送反馈等,请参阅 labs.google/fx 的
常见问题解答