ChatGPT迎来全新 GPT Image 1.5 图片生成模型，具备精准编辑、保持角色一致性、速度大幅提升

除了GPT 5.2，ChatGPT终于也更新了图片生成模型，稍早正式推出全新GPT Image 1.5，其特色跟Nano Banana Pro差不多，拥有精准的编辑能力，且能保持角色一致性，更重要是生成速度跟旧版比，提升多达4倍，我测试确实快超多。虽然 OpenAI 提到文字生成部分也有提升，但主要是加强 “密集的文字”，中文字还是不太行。

不过这也是有解决办法，有鉴于 ChatGPT 现在能精准编辑，就要求重新生成错误的字就好，我测试效果还不错。

ChatGPT迎来全新 GPT Image 1.5 图片生成模型，具备精准编辑、保持角色一致性、速度大幅提升 -

稍早OpenAI宣布正式推出GPT Image 1.5图片生成模型，这模型能在保留重要细节的同时，进行高度精确的修改，同时生成速度最高提升至4倍。 ChatGPT和API同步开放，所有ChatGPT用户现在就能体验到新模型。

GPT Image 1.5 的编辑能力表现很出色，跟最初的版本相比，在指令理解与遵循方面更可靠，能完成更精确的修改，也能在原创构图中维持元素之间的关系。简单来说，就是能针对你的需求进行图片编辑，并保留其他不变的区域。

为此我也测试一下，我使用阿达的大头照片，我先要求 ChatGPT 把服装换成西装，果然完美执行，其他细节都保留下来，不过皮肤部分稍微变白一些：

这是生成后的图片：

再来我接着要求，将阿达的手表给去除，ChatGPT 也成功执行，手上的手表消失了：：

我使用同一张大头照，然后要求 ChatGPT 根据以下提示词生成图片，效果也相当不错：

使用我上传的图片，制作一张超写实电影风格的编辑肖像，比例为16：9。采用低角度拍摄——镜头靠近地面，向上拍摄一名男子（使用图片1），他坐着并靠在一个巨大的、毁坏的钢弹头部上。
他穿着一套风化的末日风格编辑服装：多层深色工装外套，边缘破损，配有战术腰带、褪色的内衬上衣，以及磨损的战斗靴。

这是 Gemini 生成的结果：

文字生成方面也更进一步，能处理更密集、更细小的文字内容。像是：将 Markdown 内容自然排版成报纸文章、精准呈现标题、段落、粗体与表格、在影像中保留完整格式与数字信息等等。

这是 OpenAI 提供的范例图片：
ChatGPT迎来全新 GPT Image 1.5 图片生成模型，具备精准编辑、保持角色一致性、速度大幅提升 -

我也快速测试新版模型的中文字生成能力，以下是提示词：

帮我生成一张「咖啡买一送一」的海报，上面有「咖啡买一送一」、「限时优惠」、「买越多省越多，还可以寄杯」的繁体中文字，真实风格

明显有几个中文字不太对，由此可见这点还是比不上 Gemini。不过这是首次生成，通过后续的编辑修改，也能生成出中文字无误的图片：
ChatGPT迎来全新 GPT Image 1.5 图片生成模型，具备精准编辑、保持角色一致性、速度大幅提升 -

如下图，我要求 ChatGPT 将图中的「省」、「还」重新生成，原本的错字就变正确了：
ChatGPT迎来全新 GPT Image 1.5 图片生成模型，具备精准编辑、保持角色一致性、速度大幅提升 -

也不得不说，ChatGPT 的设计和配色很棒，相较于下方 Gemini 生成的图，我更喜欢 ChatGPT，也更有海报的氛围：
ChatGPT迎来全新 GPT Image 1.5 图片生成模型，具备精准编辑、保持角色一致性、速度大幅提升 -

此外，ChatGPT 侧边栏也推出专属的图像（Images）创作空间，有以下几个特色：

多种默认滤镜和热门提示（十种默认滤镜）
定期更新以反映最新趋势
一次性外观上传功能，让你可在后续创作中重复使用相同外貌，而无需反复从相册挑选

ChatGPT迎来全新 GPT Image 1.5 图片生成模型，具备精准编辑、保持角色一致性、速度大幅提升

相关推荐

发表回复