3月12日,谷歌正式发布Gemini 2.0 Flash全模态图像生成器,支持原生图像生成功能。现在,所有开发者都可以通过Gemini API和Google AI Studio中的实验版本使用Gemini 2.0 Flash进行原生图像生成。
“唠嗑式P图”,修图改图“动口不动手”
据谷歌介绍,此外,其在世界理解方面,Gemini 2.0 Flash与传统模型相比,具有明显优势。Gemini 2.0 Flash利用丰富的世界知识和增强的推理能力来生成图像,值得一提的是,OpenAI前研究科学家威廉·古斯在社交媒体上感叹道,“
多任务实测:生成图文菜谱、制作生日贺卡、给漫画上色等轻松拿捏
在Gemini 2.0 Flash原生图像生成功能开放后,首先,经过五分钟的等待,Gemini 2.0 Flash完成了然而,Gemini 2.0 Flash在运行过程中也出现了一些状况。当
随后,不过,
待Gemini 2.0 Flash完成处理后,
这次模型很快输出了结果。随着
Gemini 2.0 Flash同样很好地完成了任务。中,服装完美适配男性模特身形,且背景色也被准确替换为橙色,整体效果自然流畅,毫无违和感。
不仅如此,当Gemini 2.0 Flash还具备一项技能——生成图文并茂的菜谱。为测试其实际表现,
可以看到,模型不仅完整且条理清晰地呈现出了“番茄炒蛋”的菜谱,从食材准备、烹饪步骤到火候掌控等信息一应俱全,还在菜谱相应位置精准插入了与之匹配的。值得注意的是,在图像生成领域,众多模型在应对长段文本处理时,常陷入格式不佳、字符模糊难辨或错别字频出等问题。Gemini 2.0 Flash在这方面的表现如何呢?
约十秒钟后,Gemini 2.0 Flash便生成了一张设计精美的生日贺卡。仔细查看,贺卡上不仅完整涵盖了总体来看,Gemini 2.0 Flash原生图像生成功能的表现可圈可点,虽有一些小瑕疵,但为图像生成技术的应用拓展了边界。