ADVERTISEMENT
最新發表的DALL‧E 3,直接為AIGC帶來了兩大震撼——
- 提示詞門檻大幅度降低
- 理解語意的細微差異的細節描述,非常準確
沒錯,新版DALL‧E 3,不僅省去了提示詞工程,還順帶把語言理解能力提升了一個層次!
你只管隨意想像。詞,ChatGPT會幫你擴充;畫,DALL‧E 3幫你把細節精準畫出來。
AI就能像拍電影一般,保證從背景到人物,細節一字不差地複刻出來:
滿月下的街道,熙熙攘攘的行人正在享受繁華夜生活。
街角攤位上,一位有著火紅頭髮、穿著象徵性天鵝絨斗篷的年輕女子,正在和脾氣暴躁的老小販討價還價。
這個脾氣暴躁的小販身材高大,老道,身著一套整潔西裝,留著引人注目的小鬍子,正在用他那部蒸汽龐克式的電話興致勃勃地交談。
除了基礎細節,DALL‧E 3甚至能將模糊的形容詞如繁華、討價還價、脾氣暴躁演繹得活靈活現,和CLIP已經不在一個層次了。
同時,相比上一代老模型,DALL‧E 3自身的畫技也前進了一大步:
這種技能升級,直接把網友看傻了。
有網友已經決定取消Midjourney訂閱了。「如果Midjourney無法準確理解文本,這甚至稱不上是同台競技。」
還有網友調侃,這簡直就是為即將到來的Google Gemini施加壓力。
更多細節,我們從DALL‧E 3展示的效果一一來看。
在ChatGPT裡直接使用
相比前兩代,DALL‧E 3最大的優勢在於原生構建在ChatGPT之上。
不僅意味著語言理解能力大幅飛躍,甚至提示詞都可以讓ChatGPT自己來寫。
更多細節藏在阿特曼都忍不住自誇可愛的宣傳影片裡。
also, the video we made for dalle 3 is SO CUTE: pic.twitter.com/k1FOFTOsU5
— Sam Altman (@sama) September 20, 2023
這是一個家長把5歲小朋友腦海裡的幻想變成現實的故事。
首先家長詢問ChatGPT,「我家5歲寶寶一直在說一個『超級向日葵刺蝟』,它該長什麼樣?」
可以看到ChatGPT同時寫了四段不同風格的提示詞,並給出對應圖像
家長選擇其中偏童話插圖風格的一張後,故事的主角小刺蝟形象似乎就能固定下來了,可以繼續請ChatGPT畫出更多。
順便為小刺蝟起一個名字Larry,後面的對話中就不用每次都說「超級向日葵刺蝟」了。
主角定好了,接下來再加入更多元素,讓整個童話故事更豐富,比如為Larry畫個房子。
這裡既展示出了DALL‧E 3創作一致形象的能力,也展示出郵箱上正確寫上了LARRY的名字,解決了之前版本DALL‧E不會寫字的問題。
反正都使用了ChatGPT了,不如把故事情節也寫完?
剛編好的情節馬上就可以有配套的插畫了。
保持角色形象,遷移到完全不同的貼紙畫風也沒問題,可以直接列印出來。
注意了,最厲害的地方來了,直接讓ChatGPT總結前面對話中所有內容,寫成一個完整的睡前故事。
雖然展示到此結束,但完全可以想像配合ChatGPT外掛程式功能,還可以直接産生一本電子書出來。
就讓人想起之前網友提議,確保AI安全的最佳方法是讓OpenAI、Anthropic等公司的員工都有孩子。
這樣他們就有動力確保AGI到來時世界是安全的。
Alright solved the (meta) alignment problem. We just need all the people at OpenAI, Anthropic, etc to have lots of kids so they are incentivized to make sure world is OK if AGI happens. If you have any single friends that are working on AI, please help them get dates ASAP!
— Dylan Field (@zoink) September 16, 2023
雖然DALL‧E 3現在還不能馬上玩到,一次放出的大量範本也可以先看個夠了。
每一張點開還可以看到提示詞,都是直接用人話描述,不會太複雜。
複雜場景與不存在的概念組合,效果很驚豔。
做室內設計概念圖,光影明暗關係乍看也挑不出毛病。
配合正確寫字能力,直出海報也是生產力滿滿(沒指定文字的小字部分還有些問題)。
剛加入OpenAI不久的德州撲克牌AI之父Noam Brown也秀出了他試玩的機器人打牌圖。
Dalle 3 is coming out! I've been having a lot of fun playing around with it internally https://t.co/PIXipIpJo0 pic.twitter.com/kQuep1uVdK
— Noam Brown (@polynoamial) September 20, 2023
hard to get across how remarkable this is without trying it, but the prompt for the image above was:
— Sam Altman (@sama) September 20, 2023
"An illustration of an avocado sitting in therapist's chair, saying "I just feel so empty inside" with a pit-sized hole in its center. The therapist, a spoon, scribbles notes."
CEO阿特曼最喜歡的則是這張「酪梨看醫生」。
hard to get across how remarkable this is without trying it, but the prompt for the image above was:
— Sam Altman (@sama) September 20, 2023
"An illustration of an avocado sitting in therapist's chair, saying "I just feel so empty inside" with a pit-sized hole in its center. The therapist, a spoon, scribbles notes."
有網友去試了同樣的提示詞用在DALL‧E 2的效果,只能說字也不對、酪梨中間的洞沒畫出來,治療師更是沒有……
for reference this is what dalle 2 outputs for that same prompt pic.twitter.com/mrOPGlnkqu
— naza (@nazanazanazanaz) September 20, 2023
還記得2021年1月DALL‧E 1剛出的時候嗎?夢開始的地方就是一組「酪梨做的沙發」。
也難怪網友感歎:看看它走了多遠!
How far it’s come 😮 https://t.co/y02DpRfGjo pic.twitter.com/qCLFXqI3mt
— Nate Chan (@nathanwchan) September 20, 2023
「如有侵權,請來刪圖」
當然,除了上述特性以外,OpenAI也預告了一些神奇的新功能。
例如,DALL‧E 3即將配套推出一個圖像鑒別器。
這個分類器可以説明辨識圖像是否由DALL‧E 3生成,不僅能避免誤傷,也能在DALL‧E創作出好作品時快速將它認領成自己的。
至於在生成圖像上,OpenAI自述也做了大量努力,防止其生成暴力、色情或其他有害圖片,或是具有公眾人物(明星、名人等)姓名的圖像産生。
關於隱私方面,之前紐約時報就曾爆料稱,OpenAI正在透過某些技術,模糊掉上傳到ChatGPT的圖像中的人臉。
這也是為了避免ChatGPT變成一個徹底的「人臉辨識工具」,尤其是已經有不少照片流傳到網路上的名人明星們。
如今這個技術可能也被用到了DALL‧E 3中,防止生成侵權圖像。
同時,OpenAI也與安全紅隊合作,提高了圖像風險評估的能力。
除此之外,在訓練資料上,有了Midjourney的「前車之鑒」,OpenAI這次也學會了保護自己。
相比於直接和畫手打官司、或者等著被起訴,OpenAI在官網放出了一則訓練數據“免責聲明”:
您可以填寫表格,禁止我們的網路爬蟲GPTBot訪問您的網站。或者,您也可以發送您想要保護隱私的圖像,我們會把它從訓練資料中刪掉。
不過也有網友對DALL‧E 3演示效果不滿意,認為比不上MidJourney資深玩家出的圖,OpenAI的資金可是充裕n多倍啊。
I'm genuinely surprised how bad the demos of DALL E 3 are. I'm no AI art expert, but the ones I've seen look worse than what I'd expect from expert users of midjourney. And OpenAI has a gazillion times more money!
— Daniel Filan research-tweets (@dfrsrchtwts) September 20, 2023
還有網友開啟雷文霍克模式,開始挨個挑展示圖中漏掉的提示詞細節。
例如這張杯子裡缺少微型閃電。
這張散落在海底的只有大炮殘骸,沒有寶藏。
具體這些問題能不能通過調整提示詞改善,就要等實際上手玩過才知道了。
那麼DALL‧E 3具體什麼時候上線呢?
- ChatGPT Pro會員(20美元/月)和企業版在10月可用。
- 獨立版在今年秋天晚些時候提供(目前價格15美元可以玩115次)。
資料來源:
請注意!留言要自負法律責任,相關案例層出不窮,請慎重發文!