除了GPT 5.2,ChatGPT终于也更新了图片生成模型,稍早正式推出全新GPT Image 1.5,其特色跟Nano Banana Pro差不多,拥有精准的编辑能力,且能保持角色一致性,更重要是生成速度跟旧版比,提升多达4倍, 我测试确实快超多。 虽然 OpenAI 提到文字生成部分也有提升,但主要是加强 “密集的文字”,中文字还是不太行。
不过这也是有解决办法,有鉴于 ChatGPT 现在能精准编辑,就要求重新生成错误的字就好,我测试效果还不错。

稍早OpenAI宣布正式推出GPT Image 1.5图片生成模型,这模型能在保留重要细节的同时,进行高度精确的修改,同时生成速度最高提升至4倍。 ChatGPT和API同步开放,所有ChatGPT用户现在就能体验到新模型。
GPT Image 1.5 的编辑能力表现很出色,跟最初的版本相比,在指令理解与遵循方面更可靠,能完成更精确的修改,也能在原创构图中维持元素之间的关系。 简单来说,就是能针对你的需求进行图片编辑,并保留其他不变的区域。
为此我也测试一下,我使用阿达的大头照片,我先要求 ChatGPT 把服装换成西装,果然完美执行,其他细节都保留下来,不过皮肤部分稍微变白一些:
这是生成后的图片:
再来我接着要求,将阿达的手表给去除,ChatGPT 也成功执行,手上的手表消失了::
我使用同一张大头照,然后要求 ChatGPT 根据以下提示词生成图片,效果也相当不错:
使用我上传的图片,制作一张超写实电影风格的编辑肖像,比例为16:9。 采用低角度拍摄——镜头靠近地面,向上拍摄一名男子(使用图片1),他坐着并靠在一个巨大的、毁坏的钢弹头部上。
他穿着一套风化的末日风格编辑服装:多层深色工装外套,边缘破损,配有战术腰带、褪色的内衬上衣,以及磨损的战斗靴。
这是 Gemini 生成的结果:
文字生成方面也更进一步,能处理更密集、更细小的文字内容。 像是:将 Markdown 内容自然排版成报纸文章、精准呈现标题、段落、粗体与表格、在影像中保留完整格式与数字信息等等。
这是 OpenAI 提供的范例图片:
我也快速测试新版模型的中文字生成能力,以下是提示词:
帮我生成一张「咖啡买一送一」的海报,上面有「咖啡买一送一」、「限时优惠」、「买越多省越多,还可以寄杯」的繁体中文字,真实风格
明显有几个中文字不太对,由此可见这点还是比不上 Gemini。 不过这是首次生成,通过后续的编辑修改,也能生成出中文字无误的图片:
如下图,我要求 ChatGPT 将图中的「省」、「还」重新生成,原本的错字就变正确了:
也不得不说,ChatGPT 的设计和配色很棒,相较于下方 Gemini 生成的图,我更喜欢 ChatGPT,也更有海报的氛围:
此外,ChatGPT 侧边栏也推出专属的图像(Images)创作空间,有以下几个特色:
- 多种默认滤镜和热门提示(十种默认滤镜)
- 定期更新以反映最新趋势
- 一次性外观上传功能,让你可在后续创作中重复使用相同外貌,而无需反复从相册挑选
微信扫一扫
