2023.12.23 09:00

Midjourney能畫出文字了!V6版5大功能升級驚豔網友

ADVERTISEMENT

Midjourney重量級更新,V6版本問世!更新後最大看點是圖像更真實、細節處理更細膩:

和上一代對比來看更直觀。 

ADVERTISEMENT

就說一道馬鈴薯燉牛腩,右邊的圖不僅菜看起來更自然、更有食欲,就連木勺的細節也沒放過(左V5.2,右V6):

再來看對人物的刻畫,V6光影等細節拉滿。相比之下,V5.2根本不是一個等級(上V6,下V5.2):

ADVERTISEMENT

風景圖的處理也是一眼就能區分哪個更真實自然(左V5.2,右V6):

ADVERTISEMENT

另外,新版本還有一大看頭是可以對簡單的文字進行處理了,只需要把要繪製的文字加上「引號」,比如「Hello World!」:

終於不是亂碼了!

ADVERTISEMENT

創始人David Holz在Discord發帖公佈了V6的問世,並且表示V6是團隊從頭開始訓練的第三個模型,開發過程已持續了9個月。 

總結來說,V6共有5大升級: 

  • 更精確且更長的提示回應
  • 改進了連貫性和模型知識
  • 圖像生成和混合(remix)得到了最佳化
  • 新增了基礎文字繪製功能
  • upscale(放大器)功能得到增強,具有「subtle」和「creative」兩種模式,解析度提升兩倍

此外,David Holz表示目前V6處於「alpha test」階段,會隨時變化,之後會升級到完整版。 

這也就意味著,接下來幾周內,V6的速度、圖像品質、連貫性、提示回應和文本準確性會再次提高。 

而目前V6相比於V5來說速度更慢、成本更高(大約每次imagine消耗1gpu/min,每次upscale消耗2gpu/min),但昨天已對V6做了一次更新,速度已提高2.7倍:

V6的問世,讓網友們又有新東西玩了,各種測試對比都非常火爆:

不過,要想玩好V6,再用之前的提示策略恐怕是不行了。 

David Holz明確表示「V6的提示與V5有很大不同,你需要重新學習如何提示」。

效果:寫真真真

先來看一波網友們的測試效果。 

讓Midjourney V5.2(左)、V6(右)畫一個酒吧,需要用燈牌標注「open late」(營業到很晚),V6畫起來毫無難度: 

再來體驗一下更新後的Upscale,正常圖片是這樣嬸兒的:

Subtle(上)、Creative(下)兩種不同模式,大家更中意哪張? 

Creative連鏡子裡的細節都有處理。 

這裡還有和其它AI繪圖工具的比較,比如說DALL·E 3、Adobe Firefly。 

Midjourney V6在不同風格的圖片繪製上,都表現出眾:

是能夠以假亂真的那種了:

甚至,V6還通過了的香煙測試。不僅煙真實,手的歲月感也刻畫得淋漓盡致:

但正如上面提到的,Midjourney V6更新的不只是效果,還有提示詞。 

好在David Holz給到了一些提示小妙招,其中就包括: 

  • 避免使用無關緊要的詞,如award winning、photorealistic、4k、8k;
  • 明確表達你想要的內容,表達明確,模型理解得更好;
  • 如果你想要更具攝影感、更中立、更直接的效果,可以預設使用—style raw;
  • 較低的—stylize值(預設100)可能會有更好的提示理解,而較高的值(最高1000)可能會有更好的美學效果。

我們也來簡單上手體驗一下。 

開盒Midjourney V6

召喚V6的方法有三種,可以選擇在Midjourney Discord伺服器中鍵入命令「/settings」,或者在給Midjourney bot的直接消息(DM)中鍵入,然後使用頂部的下拉式功能表選擇V6,又或是在提示詞後手動輸入「—v 6.0」。 

我們讓Midjourney描繪一幅跨年夜的場景,要求要有漫天飛舞的大雪,還要有一個牌子上面寫著「新年快樂」: 

Please depict a New Year’s Eve scene with heavy snow falling all around, and include a sign with the words ‘Happy New Year’ on it.

該說不說,雖然很有feel,但「字」的發揮還是不穩定。

完全相同的提示詞下,V5.2版本整體偏暖色調,但這麼一看V6畫字還是很有水準的:

緊接著,點擊任意一張圖Upscale:

就可以看到兩個新的模式Subtle、Creative: 

 

參考資料:

ADVERTISEMENT