Stable Diffusion XL(簡稱 SDXL)是一個高畫質、文字轉圖片模型,使用的是 StabilityAI 技術,但很多人可能不清楚這些專業名詞或術語,只想知道「要怎麼使用一段描述提示詞來建立想要的圖片」,最快的方法是直接使用線上工具,例如之前我介紹過的「Stable Diffusion 網頁版!輸入提示詞 AI 產生圖片,開源 CC0 授權可商業用途」就能在輸入提示詞後建立圖片,還能自訂圖片風格、高度寬度尺寸。
接下來要推薦「Fast Stable Diffusion XL」是 Google 建立於 Hugging Face 平台的範例模型,主要是展示自家 Google Cloud TPU v5e 運用在 SDXL 模型的效能,TPU 是經過最佳化調整的特製 AI 加速器,對各種 AI 應用實例提供最好的速度效能。當然,使用者也能運用 Fast Stable Diffusion XL on TPU v5e 工具生成 1024×1024 尺寸圖片,幾乎沒有使用限制。
透過 Fast Stable Diffusion XL 輸入要產生圖片的提示詞(描述),在幾秒鐘內產生四張預覽圖,也能隨時調整圖片風格、negative prompts(專門用來修復一些奇怪的圖片)或是強度指標。
Fast Stable Diffusion XL on TPU v5e
https://huggingface.co/spaces/google/sdxl
使用教學
STEP 1
開啟 Fast Stable Diffusion XL 在 Hugging Face 示範模型後,直接從上方欄位輸入 Prompt 也就是圖片的提示詞(描述),點擊「Generate」就能在幾秒鐘快速產生四張預覽圖片。
如果沒有靈感,SDXL 頁面下方也有一些範例描述詞可快速帶入,或是使用以下服務上傳圖片產生:
- Image to Prompt 輕鬆將圖片轉換為 AI 製作圖片的提示詞
- AnimeGenius 用 AI 識別圖片、輕鬆生成繪圖文字提示詞
- CLIP Interrogator 用 AI 分析圖片輕鬆產出完美圖片提示詞
STEP 2
從範例模型可以感受到圖片生成速度飛快,只要不用十秒時間就能生成四張預覽圖。
STEP 3
下方有進階設定選項可預先指定要產生的圖片樣式,包括電影、攝影、日本卡通、漫畫、數位藝術、像素藝術、奇幻藝術、霓虹龐克和 3D 模型,必要時還能輸入 negative prompts(負提示詞)或調整強度。
STEP 4
試著換了一個風格、重新產生圖片,SDXL 很快就給出四張新的預覽圖,看得出來和之前的圖片樣式完全不同路線,比較可惜的是 SDXL 生成的圖片都是 1024×1024 正方形,若需要長方形或不同尺寸的圖片就要自己裁切、調整。
點擊圖片後會看到更大張的預覽圖,按下右上角小小的「Download」按鈕就能下載、保存圖片。