真「形意結合」,AI繪圖 Stable Diffusion加上字形設計模型秒懂圖像生成字形

真「形意結合」,AI繪圖 Stable Diffusion加上字形設計模型秒懂圖像生成字形

最近AI繪圖工具 Stable Diffusion 又被發掘新用途了,設計 LOGO 最關鍵的「形意結合」,被它掌握得明明白白。看見 Cat 秒畫貓貓頭:

真「形意結合」,AI繪圖 Stable Diffusion加上字形設計模型秒懂圖像生成字形

瑜伽店 YOGA 幾個字母用人體形態一轉換,風格完全不出錯:

真「形意結合」,AI繪圖 Stable Diffusion加上字形設計模型秒懂圖像生成字形

只設計其中一個字也沒問題,例如將 Dog 的 D 畫成一隻狗:

真「形意結合」,AI繪圖 Stable Diffusion加上字形設計模型秒懂圖像生成字形簡潔又傳神!

哪怕是面對中文字型,AI 也能很好地理解其中的意思,快速畫出想要傳達的 LOGO 形象:

真「形意結合」,AI繪圖 Stable Diffusion加上字形設計模型秒懂圖像生成字形

要是開店用上這個,哪還需要花幾十上百塊專門設計一個 LOGO 出來?

雖然之前也有不少設計 LOGO 的 AI 了,不過從這次生成的效果來看,還真有點不太一樣。

保留一部分原有字型的味道

事實上,在這次研究之前,已經有不少研究在考慮如何用 AI 設計 LOGO。

從效果來看,主要可以分成三類:

一是以字型為形狀限制,將圖片風格遷移上去(如圖 AB);二是以圖片風格為基底,將字型遷移到圖片中去(圖 D);三是將不同圖片的形狀和字型關聯起來,生成或彩色或黑白的圖像拼接風格 LOGO 設計(圖 CE)。

真「形意結合」,AI繪圖 Stable Diffusion加上字形設計模型秒懂圖像生成字形

然而,與下面人類手工設計的 LOGO 比起來,上面 AI 設計的效果不能說不好看,但似乎還差那麼點意思:

真「形意結合」,AI繪圖 Stable Diffusion加上字形設計模型秒懂圖像生成字形

作者們經過一通探查,發現人類手工設計的 LOGO 並不喧賓奪主。

人類設計師會在保留原本字型特色、讓人們能一眼認出單詞的基礎上,再加入一點創新之處,例如將 Jazz 中的 J 改成樂器,但其他人一眼仍然能認出“JAZZ”字型的形狀。

整體來說,就是在保留一部分字型味道的同時,加入一定的設計感。

真「形意結合」,AI繪圖 Stable Diffusion加上字形設計模型秒懂圖像生成字形

例如這是 Stable Diffusion 生成的“FROG”設計,FRO 仍然是原本字型的形狀,只有 G 變成一隻跳出去的小青蛙:

真「形意結合」,AI繪圖 Stable Diffusion加上字形設計模型秒懂圖像生成字形

如果用 Stable Diffusion 2 進一步進行後期處理的話,還能進一步實現上色功能,顯得更加生動:

真「形意結合」,AI繪圖 Stable Diffusion加上字形設計模型秒懂圖像生成字形

生成 LOGO 的風格也能隨著原本設計字型的變化,而產生不一樣的變化。

例如這是 6 種字型下生成的不同瑜伽 LOGO,每種風格都不一樣:

真「形意結合」,AI繪圖 Stable Diffusion加上字形設計模型秒懂圖像生成字形

相比之下,其他 AI 模型在生成字型的時候,倒是更喜歡保留自己的風格:

真「形意結合」,AI繪圖 Stable Diffusion加上字形設計模型秒懂圖像生成字形

那麼,這種神奇的字型設計 AI 是怎麼做出來的?

用貝塞爾曲線調整字母形狀

為了一定程度上保留原本字型的風格、以及只改變單詞中的某幾個字母,作者們想出一種“微調”字母形狀的方法 ——

那就是讓 AI 學會用貝塞爾曲線,對不同字型的字母進行小幅度變形。

(用過 PS 中“鋼筆”的小夥伴們應該對貝塞爾曲線不陌生,用它能控制滑鼠畫出一些神奇的曲線)

真「形意結合」,AI繪圖 Stable Diffusion加上字形設計模型秒懂圖像生成字形

具體控制點數量,則根據字母複雜度和字型風格進行迭代變換,直到設計出來的字母符合要求,其中橙色是初始點,藍色是後續增加的控制點:

真「形意結合」,AI繪圖 Stable Diffusion加上字形設計模型秒懂圖像生成字形

控制點數量對生成效果影響有多大?

例如這是不同數量的控制點生成字母的效果,如果數量太少,會看不清設計的圖像形狀;但數量過多又容易扭曲字型原本的形狀:

真「形意結合」,AI繪圖 Stable Diffusion加上字形設計模型秒懂圖像生成字形

基於這種核心設計思路,作者們結合 Stable Diffusion 和 CLIP,設計出了一整個字型設計 AI 模型:

其中,ACAP(as conformal as possible)損失函數基於德勞內三角形剖分演算法,對字母形狀進一步進行了約束。

例如這是 PANTS(褲子)在變形前和變形之後的形態,可以看見 ACAP 在保留褲子形態的同時,也保留了字型的效果:

真「形意結合」,AI繪圖 Stable Diffusion加上字形設計模型秒懂圖像生成字形

與此同時,為了進一步保留字型形態,作者們採用了一個低通濾波器,保證調整後的字母不與原始字母偏離太多。例如這是 Bear(熊)中的 B 調整後的形態:

真「形意結合」,AI繪圖 Stable Diffusion加上字形設計模型秒懂圖像生成字形

應用這套模型,生成每個字母的速度也還不錯。

在一塊 RTX 2080 GPU 上,生成單個字母的 LOGO 設計大約需要 5 分鐘

作者介紹

不過在 arXiv 上,作者們的名字倒是已經公開了,他們分別來自以色列特拉維夫大學、Reichman University(萊希曼大學),以及倫敦大學金匠學院:

共同作者 Shir Iluz,特拉維夫大學電子與電氣工程理學碩士,目前的研究方向是生成 AI,感興趣的方向是深度學習與電腦視覺。

另一位協作 Yael Vinker,特拉維夫大學電腦視覺博士生,曾經在以色列希伯來大學獲得電腦科學本科與碩士學位,目前研究方向同樣是深度學習與電腦視覺。

 

Qbitai
作者

量子位(Qbitai)專注於人工智慧及前沿科技領域,提供技術研發趨勢、科技企業動態、新創公司報道等最新資訊,以及機器學習入門資源、電腦科學最新研究論文、開源程式碼和工具的相關報導。

使用 Facebook 留言
發表回應
謹慎發言,尊重彼此。按此展開留言規則