ADVERTISEMENT
Midjourney 彷彿深知我們的需求,最近,它上線了一個新功能 ——/describe,可以幫我們從圖像中反推 prompt。
這個功能要怎麼用?一般人直接想到的就是把別人用AI畫好的圖片,反推回去,參考一下怎麼樣下提示詞自己來磨練磨練。
這樣想也沒錯,不過,其實他的功能不止於此。
ADVERTISEMENT
文章目錄
Midjourney 圖像反推 prompt指令怎麼用
假設你有一個想模仿的圖像,但你不知道要用什麼樣的 prompt 去描述它,這時候,describe 就幫你大忙了。比如,下圖是新海誠的《言葉之庭》(「言の葉の庭」)。
ADVERTISEMENT
拖進圖像後,Midjourney 生成了下面四種 prompt。
根據這四個 prompt,Midjourney 又生成了類似風格的四幅圖。
ADVERTISEMENT
簡直完美。
並且,Midjourney 提供的描述也可以激發出使用者的更多靈感。傳統的畫家可能會患有空白畫布綜合徵,AI 藝術家有時也會詞窮,很難找到描述照片的詞語。
ADVERTISEMENT
在 Midjourney 的 Discord 頻道上,從「/describe」就可以啟動文字描述過程了。
Midjourney 提供了一個拖放區,可以讓你拖入圖像。
然後按下Enter鍵,就可以等待 prompt 了。
四個文字提示,包括描述性詞語、樣式詳細資訊和縱橫比。寬高比在像素精確度方面與電腦類似,比如如果是一個 16:9 的圖像,它會輸出 504:283。
而四個文字提示生成後,你可以直接點選按鈕,直接用它們生成圖像,當然,在提交之前,你也可以選擇自己最佳化提示。
不想畫圖?作家也能學到「怎麼樣形容一幅畫」
更有趣的是,Midjourney 的這個新功能,竟然意外地讓作家們獲得了幫手。
如果找不到完美的形容詞來描繪一幅畫,只需要把圖像上傳到 Midjourney,文采斐然的句子就自動蹦出來了。
而 Midjourney 返回的文字提示,真是讓人驚喜連連。其中包括「palewave」、「cranberrycore」和「icepunk」等流行語,以及各種藝術家、攝影師和作者的姓名。
而提示中出現人名時,甚至是可點選的連結,可以打開Google搜尋,如果點選進去,你或許會獲得更多的靈感來源。
比如,上傳 Ross Burgener 的一張絕佳的作品,Midjourney 會這樣描述:"極光在 LED 照明的冰屋上跳舞,給雪的顏色帶來了藍色調"。
它認出了北極光,會在提示中給出建議 —— 可參考藝術家 Qlexis Gritchenko 和攝影師 Nathan Wirth。它採用的詞彙包括 「極地冰山」、「發光的天空」和「空靈的雕塑」。
網友們已玩瘋describe 功能
現在,網友們已經玩瘋了。
有網友利用 describe 功能,生成了許多穿白色蕾絲裙的美女。
有人輸入了一堆珠寶的圖像。
得到了如下的 prompt。
根據這些 prompt 生成的圖像如下。
輸入一個二次元少女。
輸出的 prompt,出圖效果很驚豔。
輸入一隻氣質憨憨的大捻角羚的照片。
生成的 prompt 如下。
輸出的 prompt 生成的大捻角羚,氣質更為冷峻。
輸入一隻海灘上的狗。
Prompt 生出了四隻埋在坑里的狗。
輸入穿著燕尾服的動漫人物。
生成如下 prompt。
生成四張動漫人物。
Midjourney 最近的進步簡直飛速
可以看到,Midjourney 最近的進步,可以用飛速形容。
NVIDIA AI 科學家 Jim Fan 猜測,Midjourney 一直在根據人類反饋(「RLHF」)進行大規模的強化學習,並且,這可能是有史以來規模最大的文字到圖像強化學習。
當使用者選擇放大圖像時,是因為他們更喜歡它。如果不把這個過程當作獎勵訊號,那真是巨大的浪費。這些資料收集起來很便宜,而且完全符合使用者群的需求。
擁有的使用者越多,可以做的 RLHF 就越好,然後獲得的使用者就越多。
他還給出了一個免責聲明,表示這就是自己的一個腦洞,自己並不認識 Midjourney 的人。
但他們一定已經是這麼做的,因為 UI 的格式看起來就像一個多項選擇題。
最後,要注意的是,同圖像生成一樣,describe 功能需要使用積分,所以需要謹慎地考慮。
而且現在,Midjourney 的免費功能,已經徹底關閉了。
參考資料:
ADVERTISEMENT