Google推出了一款名为Whisk的全新ai图像生成工具,这个工具使用户不需要提示词,只需提供图像即可帮你混合出各种风格的图像。不需要使用传统的文本提示。Whisk由Google Labs开发,结合了Gemini和Imagen 3模型,能快速将多张照片的风格组合成新的风格图像输出,生成成新的图片。
比如我们提供一张人物的、一张场景的和一个风格的图片,它就能把人物和场景风格自由组合在一起,生成这种风格的新场景人物照片。
Whisk体验地址:https://labs.google/fx/tools/whisk/unsupported-country
Whisk的主要功能和特点:
以图生图功能:Whisk的最大亮点在于它允许用户直接上传图像,生成新的图像,而不需要书写复杂的文本提示。
多图上传与风格融合:用户可以上传多张图片来定义生成图像的主题、场景和艺术风格。这种**度的输入方式允许用户将各类元素融合在一起,创造出新的图像作品。
采用先进的AI模型:Whisk利用了Google的Gemini和Imagen 3模型,这些模型增强了图像生成的质量和速度,使得生成的图像更加细腻和富有创意。
自动生成的文字提示:在生成新的图像后,Whisk还能够自动生成与之相关的文字提示。
Whisk还支持用户在创作过程中直接生成图像并进行快速修改。这意味着用户不仅可以上传图像,还可以通过添加描述性的文本来调整生成的图像,这一点增加了创作的灵活性和多样性。
此外,谷歌明确指出,Whisk其目的是快速的视觉探索,而非精细编辑。因此,生成的图像可能有时不尽如人意,这也是谷歌提供用户编辑底层提示以优化结果的原因之一。
Whisk已开放在更多国家使用,现在可以在超过 100 个国家使用,Whisk之前仅在美国地区提供试用,其他地区的用户可以等等。
下一篇: 最后一页
tortoise-tts学习资料汇总 - 高质量多声音TTS系统
2024-12-31
PaddleSpeech入门学习资料汇总 - 开源语音AI工具包
2025-01-02
pot-desktop使用指南 - 跨平台划词翻译和OCR软件
2025-01-02
understand-prompt学习资料汇总 - AI助手的探索与应用
2025-01-02
GPT4All学习资源汇总 - 在本地设备上运行大型语言模型
2025-01-02
2025-01-02
wechat-bot入门指南 - 基于ChatGPT的微信聊天机器人
2025-01-02
Cheetah - AI助手学习资料汇总 - Mac应用助力远程技术面试
2025-01-02
AI代码翻译器学习资料汇总 - 使用AI将代码从一种语言翻译成另一种语言
2025-01-02