Midjourney 學會從圖像中反推提示詞,AI 繪畫進入新階段

Midjourney 學會從圖像中反推提示詞,AI 繪畫進入新階段

ADVERTISEMENT

在各種 AIGC 產品層出不窮的今天,讓 AI 畫一張圖已經不是什麼難事。 

儘管有著「無需動筆」、「零門檻作畫」等一系列優點,但很多人並不能借助 AI 之手輕鬆獲得一幅理想中的作品 —— 難點在於「prompt」。 

Prompt 方法是一門極深的管理學問:如果不輸入精準的命令描述,產生結果就可能十分隨機,甚至與預期相去甚遠。但歸根結底,如何給出完美的 prompt,如何讓模型按照人類使用者預設的方式輸出結果,甚至如何降低花在 prompt 上的成本,很少有人清楚。 

正因此,AIGC 產業衍生出了一種專門的職業 ——prompt 工程師。前段時間,初創公司 Anthropic 在舊金山招聘「prompt 工程師和圖書館員」,給出的薪水高達 33.5 萬美元。 

或許,這一過程也能讓 AI 代勞呢?AI 會做的比人類更好嗎? 

最近,AI 繪畫神器 Midjourney 就上新了一個功能:/describe。

「今天,我們發佈了一個 /describe 命令,可讓您將圖像轉換為文字。」

具體來說,Midjourney 學會了從圖像中反推 prompt。如果你在 Midjourney 上傳一張圖片,它會提供給四個版本的描述,你可以直接拿來並進行調整,然後去產生自己想要的圖片變體。 

Midjourney 是一款 2022 年 3 月發表的 AI 繪畫工具,此前剛剛推出第五代版本,由於產生效果十分「炸裂,大量使用者迅速湧入,以至於該公司不得不關閉了免費註冊通道。 

這一次功能的更新意義重大: 

  • 改進可造訪性:透過用於 Web 顯示的 ALT 文本元素,圖像描述讓有視覺障礙或閱讀困難的人更容易造訪數位內容;
  • 增強的可搜尋性:描述可以通過搜尋引擎啟用更好的搜尋功能和索引;
  • 用於標題:可以包含描述,使圖像更加清晰;
  • 詳細 prompt:描述可用於創建更詳細的 prompt 以製作新變體,可以為快速工程提供靈感。 

 

延伸閱讀:AI繪圖服務 Midjourney v5 版超進化!細節拉滿效果逼真,可正確畫出手掌

怎麼使用? 

使用者只需從寫一個「 /describe」開始,Midjourney 提供了上傳圖像的位置:

Midjourney 學會從圖像中反推提示詞,AI 繪畫進入新階段

上傳圖片後,點擊進入:

Midjourney 學會從圖像中反推提示詞,AI 繪畫進入新階段

然後,Midjourney 根據圖像返回四個描述:

Midjourney 學會從圖像中反推提示詞,AI 繪畫進入新階段

底部的四個數位是混合按鈕,每個數位都與相應的描述相匹配。按一下數字,Midjourney 會根據新的描述重新混合圖像。

你也可以混合修改 prompt:

Midjourney 學會從圖像中反推提示詞,AI 繪畫進入新階段

這是創建示例圖像的原始 prompt:

an illustration of a brain with tree roots, psychedelic art, vibrant, by Alex Grey, by Amanda Sage, by Robert Venosa, neon colors(一幅有樹根的大腦圖像,迷幻藝術,充滿活力,作者 Alex Grey,作者 Amanda Sage,作者 Robert Venosa,霓虹顏色)

這是 Midjourney 描述的 prompt 之一,被用於混合: 

An image of an abstract brain tree with roots, in the style of mark henson, luminous colors, dark symbolism, detailed anatomy, bold lines, vibrant color, psychological phenomena illustrations, chiaroscuro woodcuts(一幅有樹根的抽象大腦樹圖像,馬克・亨森的風格,明亮的色彩,黑暗的象徵主義,詳細的解剖學,大膽的線條,鮮豔的色彩,心理現象的插圖,千鳥格的木刻)

新的繪製結果如下:

Midjourney 學會從圖像中反推提示詞,AI 繪畫進入新階段

試用體驗

該功能一經發表,就吸引了各位 AI 繪畫愛好者的注意,很多人馬上就開始創作了。 以下是透過一張 NASA 登月任務太空人照片產生的新圖片(右),的確以假亂真:

Midjourney 學會從圖像中反推提示詞,AI 繪畫進入新階段

下圖(左)為原圖,(右)為 /describe 之後生成的新結果:

Midjourney 學會從圖像中反推提示詞,AI 繪畫進入新階段

還有人想到,可以用 /describe 來進行品牌 logo 的升級。如此一來,既可以延續此前的品牌辨識度,又帶來了全新的形象。

星巴克的「新 logo」毫無違和感。

蘋果公司的經典標誌,也可以是五彩繽紛的: 

Midjourney 學會從圖像中反推提示詞,AI 繪畫進入新階段

這是愛迪達:

Midjourney 學會從圖像中反推提示詞,AI 繪畫進入新階段

百事公司可以考慮以下這款新設計:

Midjourney 學會從圖像中反推提示詞,AI 繪畫進入新階段

不管是「文生圖」還是「圖生文」,隨著使用者互動的增加,MidJourney 的效果必然會有所提升。有研究者猜測,MidJourney 一直在進行大規模的人類回饋強化學習(RLHF),而這可能是有史以來規模最大的文字轉圖像。擁有的使用者越多,MidJourney 能做的 RLHF 就越好,然後獲得的使用者會變得更多。

Midjourney 學會從圖像中反推提示詞,AI 繪畫進入新階段

資料來源:

 

bigdatadigest
作者

大數據文摘(bigdatadigest)成立於2013年7月,專注數據領域資訊、案例、技術,在多家具有影響力的網站、雜誌設有專欄,致力於打造精準數據分析社群。

使用 Facebook 留言
發表回應
謹慎發言,尊重彼此。按此展開留言規則