Stable Diffusion新玩法,一句話就可以「移除和取代」圖片中的任何部分

Stable Diffusion新玩法,一句話就可以「移除和取代」圖片中的任何部分

ADVERTISEMENT

修改一張圖,一句話就可以搞定。 

輸入一句話,就能把圖片修改好,這是很多畫師夢寐以求的修圖工具!但是話說回來,再優秀的畫師,如果僅憑自己的專業優勢,不借助其他工具,也很難在短時間內完成圖片的修改。 

現在AI 正在向圖片製作領域發起挑戰,各大科技公司、大學等開始紛紛涉足。最近一段時間,關心 AI 的人可能都有這樣一種感受:擴散模型被越來越多的人提及,基於擴散模型的各種圖片製作工具被開發出來。 

在眾多模型中,Stable Diffusion 可謂是最廣為人知的一個,為其捐贈運算資源的英國開源人工智慧公司 Stability AI 為此還獲得了 1.01 億美元融資,融資完成後,Stability AI 估值將達到 10 億美元。就在最近,還鬧出了 Stable Diffusion 背後團隊互槓的笑話,原因是他們都想當 Stable Diffusion 的所有者。 

其實這個模型的技術來源是發表在 CVPR 2022 中的一篇論文《High-Resolution Image Synthesis with Latent Diffusion Models》,署名作者一共五位,分別來自慕尼墨大學、海德堡大學和 AI 影片技術創業公司 Runway。 

Stable Diffusion新玩法,一句話就可以「移除和取代」圖片中的任何部分

研究者對 Stable Diffusion 的開發一直在繼續。就在今日,reddit 上一則貼文點讚量已經突破 800+。

Stable Diffusion新玩法,一句話就可以「移除和取代」圖片中的任何部分

 

大概意思就是:Stable Diffusion 背後團隊之一的 Runway 公司發布了一個由 Stable Diffusion 模型驅動的圖像移除和取代(Erase and Replace)工具,該工具可以修改圖像任何部分。使用者需要做的就是移除該區域並編寫自然語言描述,剩下的交給程式就可以了。 

舉例來說,一開始樹葉上是一隻七星瓢蟲,使用者移除(如紫色區域)該動物,然後輸入自然語言描述「正在找食物的蜜蜂」,點擊「取代」按鈕就可以了。

Stable Diffusion新玩法,一句話就可以「移除和取代」圖片中的任何部分

土地裡「長」出不同的植物: 

Stable Diffusion新玩法,一句話就可以「移除和取代」圖片中的任何部分

站在柱子上的不同種類的鳥: 

Stable Diffusion新玩法,一句話就可以「移除和取代」圖片中的任何部分

不同樣式的林中小屋: 

Stable Diffusion新玩法,一句話就可以「移除和取代」圖片中的任何部分

把太空人取代成衛星: 

Stable Diffusion新玩法,一句話就可以「移除和取代」圖片中的任何部分

看完上述展示,大概就是「修改一張圖,就一句話就可以完事」的感覺。 

此外,Runway 還發佈了「移除和取代」功能背後的模型,感興趣的人可以在 GitHub 上查看。該公司計畫在未來推出更多 Stable Diffusion 檢查點,並在 Runway 的 HPC 集群上進行訓練。

Stable Diffusion新玩法,一句話就可以「移除和取代」圖片中的任何部分

 

GitHub 地址:https://github.com/runwayml/stable-diffusion#inpainting-with-stable-diffusion 

專案首先通過 Huggingface 的 Diffusers 庫來使用修復模型。Diffusers 是在 PyTorch 中用於圖像和音訊產生的 SOTA 擴散模型,並作為擴散模型推理和訓練的模組化工具箱。 

相關程式碼如下所示。

Stable Diffusion新玩法,一句話就可以「移除和取代」圖片中的任何部分

同時,為了評估修復模型的性能,專案使用了與論文《High-Resolution Image Synthesis with Latent Diffusion Models》中相同的評估協定。由於 Stable Diffusion 修復模型接受文本輸入,因而只使用一個固定提示,即「photograph of a beautiful empty scene, highest quality settings.」。 

評估結果如下所示。 

Stable Diffusion新玩法,一句話就可以「移除和取代」圖片中的任何部分

網友大開腦洞,製作創意圖片 

這個「移除和取代」工具大大激發了網友的創作興趣,各種獵奇的創意作品都整出來了,讓人不得不佩服腦洞之大。 

有人使用它惡搞了前幾天宣佈辭職的英國前首相莉茲.楚勒斯。 

Twitter@aifunhouse

還有人對荷蘭畫家楊.維梅爾的油畫《戴珍珠耳環的少女》進行了一系列「改寫」,有趣極了。

Twitter@Yining Shi感興趣的讀者也可以到網站上試玩:https://app.runwayml.com/login 

資料來源: 

bigdatadigest
作者

大數據文摘(bigdatadigest)成立於2013年7月,專注數據領域資訊、案例、技術,在多家具有影響力的網站、雜誌設有專欄,致力於打造精準數據分析社群。

使用 Facebook 留言
發表回應
謹慎發言,尊重彼此。按此展開留言規則