谷歌近日推出新一代文本生成图像模型Imagen 4及高端版本Imagen 4 Ultra,重点优化了文本渲染效果。目前,两款模型已上线Gemini API付费预览版,用户也可通过Google AI Studio进行有限免费测试。
Imagen 4定位为通用模型,单张图像定价0.04美元;Imagen 4 Ultra则主打高精度文本提示响应,价格为0.06美元/张。谷歌称其输出质量优于Dall-E和Midjourney等竞品。演示中,Imagen 4 Ultra生成的太空蜥蜴攻击飞船漫画、京都樱花明信片等图像均能准确还原提示词,但风格仍显机械化。
尽管性能较Imagen 3有所提升,但行业观察认为其创新性未达预期,且AI艺术热度逐渐转向社交媒体营销等实用场景。