ADVERTISEMENT
英國薩里(Surrey)大學人工智慧研究中心(PAI)近日宣布推出名為「NitroFusion」的開源AI模型,該模型標誌著AI圖像生成技術的一大躍進。NitroFusion只需使用家用等級的電腦硬體,即可實現使用者輸入文字的同時生成圖像,且生成速度幾近即時。為創意專業人士、小型工作室及教育機構帶來前所未有的影像創作便利與效能提升。
即時生成影像,突破技術限制
過去,類似的AI圖像生成技術往往需要龐大的運算資源,僅限於大型企業使用。而NitroFusion的出現徹底改變了這一現狀,它只需單一張消費級顯示卡即可運行,讓個人創作者、小型工作室和教育機構都能輕鬆使用。
NitroFusion憑藉創新的「動態對抗框架」,突破了傳統多步驟生成模型的效能瓶頸。在單一消費級GPU(如NVIDIA RTX系列)上即可運行,用戶只需輸入提示,即可即時生成高品質影像,大幅縮短了創作迭代時間,實現快速實驗與更精細的影像控制。
ADVERTISEMENT
NitroFusion 的優勢:
- 即時生成: 使用者輸入文字的同時即可生成圖像,無需等待。
- 高品質圖像: 採用動態對抗框架,如同多位藝術評論家共同評審,確保生成圖像的高品質。
- 低硬體需求: 只需單一張高性能顯示卡即可運行。
- 開源且免費: 任何人都可以免費使用和修改程式碼,無需雲端服務或訂閱費用。
- 彈性調整: 使用者可選擇1到4個細化步驟,平衡生成速度和圖像品質。
薩里大學大學人工智慧研究中心主任Adrian Hilton教授表示:「我們相信這是世界上第一個實現如此規模和效率的互動式圖像生成技術。這項突破為使用者和產業帶來了多項飛躍,也展現了我們致力於將專業級AI功能普及化的決心。」
SketchX實驗室主任Yi-Zhe SonG教授補充道:「NitroFusion不僅僅是一個圖像生成模型,更是一種全新的AI互動方式。繼去年發布的DemoFusion之後,這項創新進一步鞏固了我們在AI領域的領先地位。
ADVERTISEMENT
技術創新:動態對抗框架
NitroFusion結合了「多專業鑑賞家」模式的對抗性訓練機制,模仿藝術評論家對影像的多方面評估(如構圖、色彩、細節等),以單步完成高品質生成。此外,其架構支持1到4步的影像細化過程,用戶可靈活選擇速度與質量的平衡。
博士研究員陳達彥表示:「這項技術在一個模型內實現靈活性與高效性,讓用戶可根據需求調整影像細緻度,進一步提升了創作自由度。」
ADVERTISEMENT
NitroFusion的應用場景與未來展望
NitroFusion的開發,標誌著創意產業進入新時代。藝術家、設計師、小型工作室與教育機構將能以更低的門檻,快速創建高品質影像,用於廣告、教育內容、遊戲設計及更多應用場景。
大學人工智慧研究中心主任Adrian Hilton教授補充:「我們希望NitroFusion的開放性,能促進全球創意社群的合作,並推動AI技術的責任化與包容化發展。」
ADVERTISEMENT
立即探索NitroFusion
- 目前,NitroFusion技術已開放使用,使用者可透過專屬網站下載模型與參閱完整文件:https://chendaryen.github.io/NitroFusion.github.io/
- 更多技術細節也可參考其論文:NitroDiffusion: High-Fidelity Single-Step Diffusion through Dynamic Adversarial Training
NitroFusion的發布,預計將為創意產業帶來深遠的影響, democratizing AI interaction,讓更多人能夠享受AI技術帶來的便利和創造力。
ADVERTISEMENT