前陣子介紹「AI Image to Music Generator」產生器,透過 AI 人工智慧技術、將使用者上傳的圖片經由分析並生成一段音樂,也就是圖片轉音樂功能,當然工具並不是隨機產生,而是真正可以分析圖片各項資訊,包括顏色、紋理、形狀和各種元素,還能選擇不同樂器,就如同使用 AI 產生圖片一樣,即使使用者不具有任何的音樂製作背景或技能,依然可以使用這些工具快速完成。
接下來要介紹的「Image to SFX」是將圖片轉為音效(SFX)的 AI 工具,依照開發者所述,這也是一個針對不同聲音模型、同張圖片產生音效的比較器,使用者只要將圖片拖曳到產生器,選擇一個 AI 模型後就能快速產生長度約 10 秒左右的音效,這段音效很可以描述相片代表的畫面或環境。
例如上傳一張露營的相片,Image to SFX 會給出蟲鳴鳥叫、很靜謐的聲音;在海邊看海喝咖啡的相片則會有海浪拍打岸邊的聲音,準確度相當高。
Image to SFX 提供四種 AI 模型選項:MAGNet、AudioLDM-2、AudioGen 和 Tango,產生音效很快,完成後下載為 .wav 格式,也可以使用在任何想使用的地方。
Image to SFX
https://huggingface.co/spaces/fffiloni/Image2SFX-comparison
使用教學
STEP 1
開啟 Image to SFX 網站後先點選圖片右上角按鈕「移除圖片」,再把生成音效的相片拖曳上去,接著從左下模型選項,不確定要選什麼直接選 AudioLDM-2 即可。
STEP 2
點擊「Submit」送出後就會開始分析、處理並產生音效,下方會顯示預估時間,等待整個流程跑完。
STEP 3
產生的音效會顯示於下方「Audio output」,長度大約 10 秒左右,可調整播放速度、直接在瀏覽器預覽。
點擊右上角「Download」將產生的音效保存為 .wav 格式,由於是 AI 產生的內容,可自由使用於各種用途而不受版權或任何規範。
值得一試的三個理由:
- 只要將圖片拖曳到產生器,選擇一個 AI 模型後就能快速產生適合的音效
- 生成的音效能準確描述相片代表的畫面或環境,也有不同的 AI 模型可以選擇
- 音效可使用於影片、遊戲、音樂等創作不受版權限制