近期科技圈最火熱的關鍵字莫過於「AI 人工智慧」,雖說相關概念與技術早在數十年前就有,但由 ChatGPT 自然語言對話模型所帶起的一波「生成式 AI 技術」浪潮讓 AI 再次躍升為市場寵兒,許多技術也如雨後春筍般出現在世人面前。
提到生成式 AI 技術,近期另一個發展快速的類型,肯定就是「圖像生成式 AI」,使用者只需透過文字下達指令,描述心中理想的畫面內容與風格,就能在短時間內產出到位的影像成品,而且無論是模仿繪畫的藝術風格或筆觸,甚或是比擬真實攝影作品的細膩程度都讓人難分真假,有人因此預言,未來插畫師、攝影師準備要失業了!
在 2022 年接觸圖像生成式 AI 的許鴻潮(鳥巢老師),是一個擁有 30 年平面設計、20 年攝影師資歷的專業創作者,因為看到 AI 技術的發展潛力而埋首其中,僅利用短短一年的時間就陸續在網路上創立多個圖像生成式 AI 技術的社群,並以自身教學經歷,開設各類型的 AI 生成課程,更受邀至各大專院校擔任講座導師,不少高含金量的課程也陸續規劃中。
對於許鴻潮來說,圖像生成式 AI 雖然是一個仍在發展中的技術,但無論在個人應用、藝術創作甚至是商務領域,都已經證明其不凡的價值,也肯定會對相關生態有著翻天覆地的影響力,這也是他願意投入龐大心力引領更多人學習圖像生成式 AI 技術的主要原因。
自學設計,透過接案擴展更豐富的人生
本業偏平面設計、攝影與講師…等跨領域類型的許鴻潮,其實大學本科是社會學系,走的一直是「斜槓」路線。從小就喜歡畫畫的他,透過自學曾拿下縣市級別繪畫比賽的冠軍,不過當時的人普遍不看好繪畫的發展性,使得他只好乖乖的投入「正常」的學習科目。雖說許老師當年鑽研的並非藝術或設計學門,但他仍維持自學,在大三時就開始兼差平面設計的工作,後來也曾在政大廣告所的想像與敘事學程進修,為後來的創作打下基礎。
退伍後許鴻潮進入知名出版集團擔任美術編輯,但不久後便遇到 SARS 疫情因而離開原本的工作崗位,於是當下決定轉以接案為生,也因為接案的需求,不得不精進攝影技巧,甚至還學習了影音拍攝剪輯,3D 特效設計,接案人生一走就是超過 20 年。
或許是血液中流淌著不安於現況、求知若渴的基因,許鴻潮藉由工作不斷累積更深厚、豐富的知識及技術,過程中更因技術嫻熟而獲聘為 Nikon、Adobe、Capture One…等全球大廠的官方特約講師。
圖像生成式 AI 為藝術創作帶來啟發
談到近期蓬勃發展的 AI 相關應用,許鴻潮說自己其實不算太早「上車」的一群,在 2022 年初左右,他偶然發現自己的社群平台上有不少朋友分享了許多視覺效果出色、畫面又精緻的數位影像作品,一問之下才知道是出自「圖像生成式 AI」的傑作,於是勾起他對相關技術的強烈求知欲,不過由於當時很多人使用的 Disco Diffusion 需要具備一定的程式基礎才能駕馭,讓他只能暫時作罷,而後來得知 MidJurney 進行封測時,又再次引燃他對 AI 圖像生成服務的興趣,也順利取得邀請碼,自此便一頭栽入圖像生成式 AI 的浩瀚宇宙中。
許鴻潮回憶剛投入 AI 圖像生成應用的第一年,心態上可說是近乎「狂熱」,每天都要坐在電腦前測試各種指令長達 8 小時以上,因此對圖像式 AI 生成技術未來的發展性有了更深一層的認識,光是透過描述指令,就可以在 20 秒至 60 秒之間生成四張圖片,還能持續依據已生成的圖片繼續優化其藝術效果,以「可能性」來說真的是無可限量,也因為圖像生成的高效率與優異的品質,許鴻潮覺得自己又重拾對藝術創作的熱情!過去需要花很多時間構思草圖、使用工具動手繪圖來呈現腦中的想法,現在一切都能讓 AI 生成代勞,而且過程無需曠日費時。
後來圖像生成式 AI 技術有更多新服務問世,包括大家熟知的 DALL-E、Stable Diffusion、Leonardo.Ai 與 Adobe 的 Firefly…等,甚至微軟在今年也宣佈大舉投資 Open AI,並於年初推出整合 DALL-E 模型的 Bing Image Creator 服務,這些都陸續成為許鴻潮的研究對象。其中 Stable Diffusion 因為提供了應用程式與模型免費開源,可以允許使用者自行建置在本地端的電腦並有更高的個人化調校彈性,因此成為許鴻潮現階段創作的主力。
談及圖像生成式 AI 技術,許鴻潮認為內核的 AI 其實是「有靈魂的」,而非單純只是應用程式代碼或龐大資料的集結。相較之下,人類會受到諸多既有框架的限制,而 AI 的思維更天馬行空;同時與 AI 溝通,對許鴻潮而言會比跟設計師、插畫師溝通要來得更容易且直接,這也是他認為 AI 在影像創作上極具潛力的主因之一。
入門 AI 應用,過程苦樂兼具
生成式 AI 技術為何會大爆發?許鴻潮認為是因文本對話模型 ChatGPT 打破大家對過往對話式機器人的刻板印象,且應用並非只是對談或娛樂性質,而是可以廣泛、深入應用到更多的領域,不只是資料搜尋、論文研究與程式撰寫,ChatGPT 也快速走入你我的日常生活中,因此他很鼓勵大家儘早就開始研究 AI,絕對會是一個改變未來的機會。
對於想入門生成式 AI 技術的新手,許鴻潮提出幾個建議,其中最重要的就是投入時間、有耐心地進行研究,畢竟生成式 AI 雖有極大發展潛力,可以為我們呈現出各種影像風格、甚至是去模仿不同的藝術流派,但要能掌握與 AI 溝通的「Prompt (提問的關鍵字,又被稱作咏唱的咒語)」更是關鍵中的關鍵,新手會需要花不少時間反覆嘗試,才能獲得想要的成果。
也因為各類型的圖像生成式 AI 服務多半有著非常快節奏的更新進程,因此使用者需要隨時適應每一次的更新,像是在今年三月,就發生了七款圖像生成式服務同時進行大更新的狀況,對於潛心研究的許鴻潮來說,真的是一整個難以招架!雖說如此,他卻仍樂在其中,對他來說,圖像生成式 AI 的學習過程,可以用「痛,並快樂著」來形容。
至於應該推薦哪些服務給初入門圖像生成式 AI 的人呢?許鴻潮認為可以先選擇免付費的雲端服務會比較沒有壓力,像微軟的 Bing Image Creator 就是很不錯的入門磚,加上近期也更新了 DALL-E3 的新模型,圖像生成品質比過去更好,玩起來也會比較有成就感。
但由於 Bing Image Creator 的影像尺寸固定,也無法透過生成的圖片進行後續改進,若想再進階,則可選擇 Leonardo.AI,這也是他在大學授課時主要教學的工具,雖說學習成本不低,但相對於操作介面更複雜的 Stable Diffusion 來說更容易上手,學習曲線也不那麼陡峭。另外,雲端版本的 Midjourney 雖然需要付費訂閱,但也是相對較可控的選擇之一。
單機運行 AI,對硬體規格有極高要求
以許鴻潮目前的創作主力 Stable Diffusion 來說,軟體本身是開源形式因此免付費,但在生成圖像時需仰賴較強大的硬體配置來滿足基本的運算需求,GPU 就是當中最重要的一環,在圖像生成時佔了約 90% 的硬體負載,目前市場主流會選擇使用 NVIDIA 的中高階顯卡。另外,圖像生成的速度也與 GPU 的 CUDA 數量息息相關,且 VRAM 雖說只要求 6GB 以上,但若是需要生成尺寸更大、解析度更高的圖像,VRAM 的規格建議是愈大愈好,若是要用作模型訓練,甚至建議 VRAM 能在 12GB 以上,同時電腦的主記憶體也需要有一定的容量規模,才能確保圖像生成時的穩定性,以桌機來看建議 24GB 以上、筆電則建議 16GB 以上的規格。
旗艦級效能,NVIDIA Studio 認證加速創作效率
因為 Stable Diffusion 對硬體效能的要求高,故以往許鴻潮是透過桌上型主機進行 AI 圖像生成創作,但如果遇到要外出執行專案或進行教學時,想即時展示圖像生成的功能,就得使用其他的雲端平台,或遠端連線家中的桌上型主機,使用起來非常不方便,一旦處在網路品質不佳的環境基本上就無法執行,更不用說家中主機若意外關機或當機,還得請家人協助重新開機,為他帶來不少困擾。
為解決上述問題,許鴻潮近期親身體驗了由電競大廠微星推出的 MSI Stealth 17 Studio,這台筆電在行動平台中可謂「頂規」的存在,除配置第 13 代 Intel Core i9-13900H 處理器,更搭載 NVIDIA GeForce RTX 4080 筆記型電腦 GPU,擁有 12GB GDDR6 規格的 VRAM,不僅運算性能絕佳,也能滿足大尺寸、高解析度圖片生成與模型訓練的需求,而許鴻潮自己實測也發現效能表現基本上不遜於桌機版本的 RTX 3090 GPU,可流暢運行 Stable Diffusion 並隨時進行圖像內容的生成,在教學場合進行即時展示也完全沒問題,有助於學員深入了解詳細的操作流程與細節。
值得一提的是 Stealth 17 Studio 也通過 NVIDIA Studio 認證,針對創作者常用的軟體工具,提供最佳化的加速效果,像許鴻潮本身就是 Adobe 官方特約講師,經常利用 Photoshop、Lightroom、Illustrator、Premiere Pro 與 After Effect…等進行創作,透過 NVIDIA Studio 專屬的驅動程式確實能讓這些應用程式的運行達到最佳化,帶來更高效與出色的穩定性。
更不用說 Stealth 17 Studio 還配備了 17 吋 Mini LED 4K 螢幕,不僅畫質細膩,支援 100% DCI-P3 色域顯示,符合DisplayHDR 1000標準認證,能提供極致真實的色彩表現,能兼顧舒適性與影像呈現的專業度,絕對可以滿足專業設計工作者的要求。
實現「無處不算圖」的彈性,隨時隨地進行高效創作
以許鴻潮的工作型態來說,無論創作或教學,其實都蠻常需要四處移動,而一直以來使用的 Macbook 採用的是 AMD 顯卡解決方案,基本上難以滿足 Stable Diffusion 的運行要求,因此只好透過遠端連線 (到家裡的桌上型主機) 的方式進行 AI 生成測試與創作,致使操作體驗不佳,且十分仰賴穩定的網路環境,反觀 Stealth 17 Studio 讓他真正有種「解放」的感受,實現「無處不算圖」的自由,也能在有靈感時,隨時隨地打開筆電,進入創作情境之中。
正因 Stealth 17 Studio 實現了高效能的「可攜性」,許鴻潮認為對圖像生成 AI 創作者而言,就像是獲得了一個隨時可用且資源無限量的影像數據庫,著實為設計工作帶來超乎想像的助益。
請注意!留言要自負法律責任,相關案例層出不窮,請慎重發文!