CLIP Interrogator 用 AI 分析圖片輕鬆產出完美圖片提示詞
時下很熱門的 AI 人工智慧服務除了協助使用者產生、彙整文字內容,也具有生成圖片的功能,平常會用到圖片的話就不用辛苦從免費圖庫尋找(可能還很容易和其他人撞圖),直接以 AI 產生也沒有版權上的疑慮,不過在生成圖片時最令人頭痛的就是輸入提示詞 Prompt 吧!好的圖片描述有助於產生更貼近使用者想像、也更細膩的結果,但對中文使用者來說要寫出英文的提示詞並不容易。
本文要介紹「CLIP Interrogator」是協助使用者產生圖片提示詞的線上工具,將圖片上傳、AI 會分析圖片後產生良好的提示詞 Prompt,方便使用者在其他 AI 圖片工具建立類似結果(看起來可能很像但不一樣)。
其他我曾介紹過的圖片轉文字產生器還有以下:
CLIP Interrogator 2.1 使用 Stable Diffusion 2.0、ViT-H-14 OpenCLIP 模型以分析、產生好的圖片提示詞,也有不同模式和產生的細節可選擇,分析圖片時需要一些時間,不過可以得到相當優異的提示詞結果,必要時還能自行修改、交給其他 AI 圖片產生器生成。
CLIP Interrogator 2.1
https://huggingface.co/spaces/fffiloni/CLIP-Interrogator-2
使用教學
STEP 1
打開 CLIP Interrogator 網站(目前架設在 Hugging Face 空間),直接把要轉換的圖片拖曳到網頁上。
STEP 2
下方有幾個不同的分析模式:best、classic 和 fast ,best 速度最慢、可以分析出最多細節;反之 fast 是速度最快、但可能就沒有那麼多,最下方有範例可以測試。
另外還有一個「best mode max flavors」應該是調整模式下可產生的形容詞數量,維持預設值即可。
分析時右下角會有個時間預測,不過不太準確,等待工具的分析和生成流程結束後就會有圖片描述,例如我在寫這篇文章時嘗試上傳了一張「咖啡」照片,產生提示詞如下:
a cup of coffee sitting on top of a table, by Adam Chmielowski, shutterstock, photorealism, volumetric backlighting, paper cup, close up food photography, stock photo
STEP 3
將 CLIP Interrogator 產生的圖片描述丟到其他 AI 圖片產生器就能生成相似、但又不太一樣的圖片,例如我曾介紹過的 Stable Diffusion 網頁版或是 Midjourney ,真的超方便!
值得一試的三個理由:
- CLIP Interrogator 可以自動分析圖片,並快速產生良好的提示詞
- 提供多種模式和細節可供選擇,讓使用者可以根據自己的需求生成不同的提示詞
- 提示詞可以使用在其他 AI 圖片產生器,讓使用者製作出類似的圖片