谷歌DeepMind近日推出全新Gemini 2.5 Flash图像编辑模型,该模型在Gemini应用中可根据文字指令,更精准地修改图片,尤其在人物与动物外观一致性保持方面表现突出。相比此前图像生成工具,其图文修改准确率更高,在多项任务中优于GPT-4o。
新模型支持“角色一致性”功能,可在多张生成图像中维持同一对象的外观一致,适用于品牌素材与产品目录制作。同时,支持局部文字编辑,无需手动圈选即可完成背景虚化、瑕疵去除等操作。
Gemini 2.5 Flash还支持融合最多三张图像、风格迁移及“现实推理”模拟简单因果关系。该模型已上线Gemini应用,开发者可通过相关平台试用。