“唠嗑式P图”，修图改图“动口不动手”！一键给漫画上色、生成图文菜谱......

更新时间：2025-03-14 22:30:44 浏览次数：

　　3月12日，谷歌正式发布Gemini 2.0 Flash全模态图像生成器，支持原生图像生成功能。现在，所有开发者都可以通过Gemini API和Google AI Studio中的实验版本使用Gemini 2.0 Flash进行原生图像生成。

　　“唠嗑式P图”，修图改图“动口不动手”

　　据谷歌介绍，此外，其在世界理解方面，Gemini 2.0 Flash与传统模型相比，具有明显优势。Gemini 2.0 Flash利用丰富的世界知识和增强的推理能力来生成图像，值得一提的是，OpenAI前研究科学家威廉·古斯在社交媒体上感叹道，“

　　多任务实测：生成图文菜谱、制作生日贺卡、给漫画上色等轻松拿捏

　　在Gemini 2.0 Flash原生图像生成功能开放后，首先，经过五分钟的等待，Gemini 2.0 Flash完成了然而，Gemini 2.0 Flash在运行过程中也出现了一些状况。当

　　随后，不过，

　　待Gemini 2.0 Flash完成处理后，

　　这次模型很快输出了结果。随着

　　Gemini 2.0 Flash同样很好地完成了任务。中，服装完美适配男性模特身形，且背景色也被准确替换为橙色，整体效果自然流畅，毫无违和感。

　　不仅如此，当Gemini 2.0 Flash还具备一项技能——生成图文并茂的菜谱。为测试其实际表现，

　　可以看到，模型不仅完整且条理清晰地呈现出了“番茄炒蛋”的菜谱，从食材准备、烹饪步骤到火候掌控等信息一应俱全，还在菜谱相应位置精准插入了与之匹配的。值得注意的是，在图像生成领域，众多模型在应对长段文本处理时，常陷入格式不佳、字符模糊难辨或错别字频出等问题。Gemini 2.0 Flash在这方面的表现如何呢？

　　约十秒钟后，Gemini 2.0 Flash便生成了一张设计精美的生日贺卡。仔细查看，贺卡上不仅完整涵盖了总体来看，Gemini 2.0 Flash原生图像生成功能的表现可圈可点，虽有一些小瑕疵，但为图像生成技术的应用拓展了边界。

推荐图文