CLIP Interrogator 用 AI 分析圖片輕鬆產出完美圖片提示詞

時下很熱門的 AI 人工智慧服務除了協助使用者產生、彙整文字內容，也具有生成圖片的功能，平常會用到圖片的話就不用辛苦從免費圖庫尋找（可能還很容易和其他人撞圖），直接以 AI 產生也沒有版權上的疑慮，不過在生成圖片時最令人頭痛的就是輸入提示詞 Prompt 吧！好的圖片描述有助於產生更貼近使用者想像、也更細膩的結果，但對中文使用者來說要寫出英文的提示詞並不容易。

本文要介紹「CLIP Interrogator」是協助使用者產生圖片提示詞的線上工具，將圖片上傳、AI 會分析圖片後產生良好的提示詞 Prompt，方便使用者在其他 AI 圖片工具建立類似結果（看起來可能很像但不一樣）。

其他我曾介紹過的圖片轉文字產生器還有以下：

CLIP Interrogator 2.1 使用 Stable Diffusion 2.0、ViT-H-14 OpenCLIP 模型以分析、產生好的圖片提示詞，也有不同模式和產生的細節可選擇，分析圖片時需要一些時間，不過可以得到相當優異的提示詞結果，必要時還能自行修改、交給其他 AI 圖片產生器生成。

CLIP Interrogator 2.1
https://huggingface.co/spaces/fffiloni/CLIP-Interrogator-2

使用教學

STEP 1

打開 CLIP Interrogator 網站（目前架設在 Hugging Face 空間），直接把要轉換的圖片拖曳到網頁上。

STEP 2

下方有幾個不同的分析模式：best、classic 和 fast ，best 速度最慢、可以分析出最多細節；反之 fast 是速度最快、但可能就沒有那麼多，最下方有範例可以測試。

另外還有一個「best mode max flavors」應該是調整模式下可產生的形容詞數量，維持預設值即可。

分析時右下角會有個時間預測，不過不太準確，等待工具的分析和生成流程結束後就會有圖片描述，例如我在寫這篇文章時嘗試上傳了一張「咖啡」照片，產生提示詞如下：

a cup of coffee sitting on top of a table, by Adam Chmielowski, shutterstock, photorealism, volumetric backlighting, paper cup, close up food photography, stock photo