苹果公司发布了名为MGIE的开源人工智能模型,能根据自然语言指令编辑图像。MGIE利用多模态大型语言模型MLLM解释用户指令并执行像素级操作,能进行Photoshop风格的修改、全局照片优化和局部编辑等操作。
MGIE将MLLMs集成到图像编辑过程中,通过推导出富有表现力的指令和生成视觉想象力来实现编辑。该模型可以处理各种编辑情况,并可以根据用户偏好执行全局和局部编辑。
MGIE是一个开源项目,用户可以在GitHub上找到代码、数据和预训练模型,并提供了一个演示笔记本展示如何使用MGIE完成各种编辑任务。