上個月 Google 釋出全新的 Gemini 3 Pro Image 更新(簡稱 Nano Banana Pro),AI 生成圖片終於進入可以正確顯示中文的時代!這對中文使用者來說是一大利多,不但生成圖片更有效率,也不用後續調整編輯,幾乎是生成後就能直接使用,不僅如此,還有轉換影像風格、結合多張圖片等功能,AI 思考能力變得更強大。
OpenAI 的反擊:GPT Image 1.5 即時登場
有鑑於此,OpenAI 不得不急起直追,繼前幾天推出全新 GPT-5.2 模型,再帶來全新「GPT Image 1.5」圖片生成模型!大家一定很好奇 GPT Image 1.5 更新帶來哪些改變呢?
簡單來說它不是只改良生成圖片效果,更重要的是能夠更好理解使用者輸入的提示詞,包括更遵循指令,對圖片進行更準確的編輯修改,而且生成圖片速度提升四倍!如果厭倦以往 ChatGPT 在生成圖片時總是需要一段時間等待,這次 GPT Image 1.5 更新對於速度提升會很有感。
OpenAI 與 Google 的策略差異
OpenAI 和 Google 走的路線不太一樣,ChatGPT 偏向透過多次「反覆修改」讓生成的結果更好,因此維持圖片一致性就成為它的目標,例如使用者在與 AI 進行互動、編輯圖片時始終能夠維持圖片精確性。相較於 Google 的 Nano Banana Pro 可能一次就能生成接近成品的圖片還是不太一樣。
如果使用者的主要任務是編輯現有圖片,例如替換某個人物髮型、穿著,將風景照更改成不同時間,或是把人物帶入另一個不同的主題等,真的可以試試看 GPT Image 1.5,或許效果會比 Nano Banana Pro 來得更好也不一定喔!不過 GPT Image 1.5 目前還無法 100% 正確生成中文字,仍存在部分文字顯示錯誤等問題,相較於之前有改善一些,好消息是可以透過多次的修改來讓文字顯示正常。
網站資訊
網站名稱:ChatGPT Images
網站鏈結:https://chatgpt.com/images
ChatGPT Images 使用教學
開啟 ChatGPT 後點選左上角「圖像」會看到 GPT Image 圖片生成功能,直接輸入要生成圖片的提示詞,或是在圖片上套用其他風格,點選下方的風格、選擇圖片就能快速編輯,最下方也有一些範例。
我直接複製之前在 Gemini 3 Pro Image 一文使用的提示詞,試試看 GPT Image 1.5 會生成什麼樣的效果。
接著就會在 ChatGPT 對話功能建立圖片,生成速度上有明顯比之前要快一些。
下圖是使用 GPT Image 1.5 生成的中文圖片,可以看到有些文字還是會有問題(例如下圖的個、驟、後、姿勢和臂等字),反覆和 AI 進行對話來修正這些有問題的字,不過要注意免費版很容易達到圖片生成上限。
GPT Image 1.5 更擅長的是對圖片進行編輯、修改,試著上傳一張真實圖片,再讓 ChatGPT 將它重新繪製為動漫風格,同時保留原始圖片中的文字。
除了第二個畫面最左側多了一個人以外,基本上沒什麼太大問題,而且原始圖片中文字也能正確顯示。
測試一下讓 GPT Image 1.5 生成中文海報,乍看之下好像還不錯,問題依然還是在部分中文字無法正確顯示。
使用相同提示詞讓 Nano Banana Pro 生成圖片,效果其實也很不錯,而且重點明顯,最重要的是中文字可以正確顯示,幾乎沒有錯字發生。
最後再來測試 GPT Image 1.5 編輯修改圖片的功能,不得不說這些測試下來會發現這個效果最棒,我試著將一張真實拍攝的照片傳送給 ChatGPT,並透過提示詞要求 AI 將照片替換成夜晚的效果。
實際附上轉換前後的對照,看得出來細節部分都很不錯,而且這還只是單次編輯後生成的圖片,如果需要更多的細節微調,也可繼續和 AI 溝通。


