OpenAI 推出 4o Image Generation 圖像生成功能,AI 繪圖更精準、擬真、未來免費用戶也能用

OpenAI 推出 4o Image Generation 圖像生成功能,AI 繪圖更精準、擬真、未來免費用戶也能用

ADVERTISEMENT

OpenAI 日前宣布,將旗下最新的圖像生成器整合至旗艦語言模型 GPT-4o 中,推出名為「4o Image Generation」的全新功能。此功能不僅能產出精美的圖像,更著重於高度的實用性,可生成精準、擬真且符合使用者需求的視覺內容,有望顛覆人們使用 AI 進行圖像創作的方式。

OpenAI 長期以來將圖像生成視為語言模型的核心能力之一,因此致力於打造最先進的圖像生成器,並將其與 GPT-4o 模型完美整合。OpenAI 指出,此功能的目標不僅是藝術創作,更要成為強大且實用的工具,協助使用者在各種情境下更有效地溝通與表達。

 

 

OpenAI 推出 4o Image Generation 圖像生成功能,AI 繪圖更精準、擬真、未來免費用戶也能用

應用情境廣泛,從會議記錄到科學圖解

OpenAI 在官方部落格展示了 4o Image Generation 的多種應用情境,從模擬白板會議記錄、生成富含意義的文字圖像、創作趣味漫畫,乃至複雜的科學實驗圖解,GPT-4o 皆能輕鬆應對,展現其強大的多模態能力。

舉例來說,使用者上傳一張寫滿方程式和筆記的白板照片,GPT-4o 不僅能理解照片內容,還能根據使用者指示,將其轉換為更清晰易懂的圖表。此外,GPT-4o 也能根據零散文字,自動生成充滿創意的磁性詩詞圖像,甚至能根據簡單的文字描述,創作出連環漫畫,例如描述小蝸牛想買跑車的幽默故事,GPT-4o 就能自動生成四格漫畫,生動呈現故事情節。

OpenAI 推出 4o Image Generation 圖像生成功能,AI 繪圖更精準、擬真、未來免費用戶也能用

精準控制圖像細節,多輪對話逐步完善

OpenAI 強調,4o Image Generation 功能具備極強的指令遵循能力,能精確按照使用者提示生成圖像,並注重細節。相較於其他系統在處理大量物件時可能遇到的困難,GPT-4o 據稱可同時處理多達 10 至 20 個不同的物件,並更精準地將物件的特性和相互關係融入圖像中,讓使用者更好地控制圖像生成結果。

此外,4o Image Generation 功能原生整合於模型中,使用者可透過自然對話方式逐步完善圖像。GPT-4o 能理解聊天上下文中的圖像和文字資訊,並確保多輪迭代中圖像風格的一致性,這對於需要不斷調整和實驗的情境,例如設計電玩遊戲角色,顯得格外有用。

文字渲染能力提升,結合世界知識更聰明

OpenAI 特別強調 GPT-4o 在文字渲染方面的改進,認為「一圖勝千語」,但適當加入精準文字更能提升圖像意義。GPT-4o 能將精確符號與圖像完美融合,使其成為更強大的視覺溝通工具。

原生圖像生成能力使 GPT-4o 能將龐大知識庫與圖像生成過程結合,產生更聰明、更有效率的結果。例如,使用者可要求 GPT-4o 根據程式碼生成視覺化圖表,或根據食譜文字生成雞尾酒圖片,甚至生成天氣資訊圖表或鯨魚種類指南。

OpenAI 推出 4o Image Generation 圖像生成功能,AI 繪圖更精準、擬真、未來免費用戶也能用

仍有進步空間,OpenAI 強調安全與倫理

儘管 4o Image Generation 功能強大,但 OpenAI 也坦承目前模型仍有裁切、幻覺、圖表生成錯誤等限制,將在後續版本中努力改進。

OpenAI 強調其 AI 模型的安全與倫理考量,在追求創作自由的同時,也會堅守嚴格安全標準,防止模型被用於生成有害內容。所有 GPT-4o 生成的圖像都會附帶 C2PA 元數據,標示圖像來源,提高透明度。

逐步開放存取,未來將整合至 Sora 平台

OpenAI 宣布,4o Image Generation 功能即日起逐步向 ChatGPT Plus、Pro、Team 和 Free 用戶開放,並將在不久的將來提供給 Enterprise 和 Edu 用戶。此外,此功能也將整合至 Sora 平台。開發人員也將在未來幾週內透過 API 存取 4o Image Generation 功能。

使用者只需像聊天一樣與 GPT-4o 互動,描述所需的圖像細節,就能輕鬆創建和自訂圖像。由於 GPT-4o 生成的圖像細節更豐富,渲染時間可能稍長,通常約需一分鐘。

OpenAI 相信,4o Image Generation 功能將為使用者帶來前所未有的創作體驗,並將圖像生成技術推向新高度。隨著此功能的普及,各領域可望出現更多由 AI 驅動的創新應用。

janus
作者

PC home雜誌、T客邦產業編輯,曾為多家科技雜誌撰寫專題文章,主要負責作業系統、軟體、電商、資安、A以及大數據、IT領域的取材以及報導,以及軟體相關教學報導。

使用 Facebook 留言
發表回應
謹慎發言,尊重彼此。按此展開留言規則