阿里巴巴集團的數字技術與智能骨幹業務阿里雲今日於2023世界人工智能大會(WAIC)上發佈最新人工智慧(AI)繪畫創作大模型「通義萬相」。這一前沿生成式AI模型現已向中國大陸企業客戶開啟邀測。
阿里雲同時宣佈推出通用框架ModelScopeGPT,旨在協助用戶透過使用ModelScope平台上的多元AI模型完成各類複雜度高和專業性強的AI任務,適用領域包括語言、視覺和語音等。開源模型即服務(Model-as-a-Service)平台ModelScope 由阿里雲於去年推出,目前已有超過900個AI模型。
阿里雲智能首席技術官周靖人表示:「『通義萬相』代表著我們在前沿生成式AI模型發展歷程上的又一重要里程碑,我們正不斷探索重塑行業發展模範的技術,以協助企業和社群釋放更大創造力及生產力。」他續指:「『通義萬相』的發佈將進一步讓高質量AI生成圖像於不同行業廣泛使用,協助電子商務、遊戲、設計和廣告等眾多領域的企業開展創新的AI藝術創作和創意表達。」
「通義萬相」具備強大圖像生成能力
生成式AI模型擅長處理多種任務,可根據中英文文字指令生成細節豐富、風格多樣的圖像,包括水彩畫、油畫、國畫、動畫、素描、扁平插畫和3D卡通。「通義萬相」可將圖片轉換成風格類似的新圖片,還可透過風格遷移將圖像風格化,即保留原始圖像的內容同時應用另一圖像的視覺風格,將任何圖像轉換為具有特定風格的新圖像。
該模型藉助阿里雲於知識重組、視覺AI和自然語言處理(NLP)方面的開創性技術,採用多語言資源以強化模型訓練。「通義萬相」擁有強大的語義理解能力,因此可生成更為精確及符合語境的圖像。
此外,透過優化基於訊號雜訊比的高解析度擴散過程,該模型可於確保構圖準確度及細節清晰度之間取得平衡,同時其於乾净背景上生成高對比度及具視覺衝擊力圖像的能力亦可顯著提升。
阿里雲使用其自研大模型Composer開發「通義萬相」,可更好地控制最終輸出圖像,如空間佈局和調色盤,同時確保圖像合成兼具品質和創意。
推出ModelScopeGPT以處理複雜AI任務
阿里雲同時推出的ModelScopeGPT旨在透過一套技術框
阿里雲於今年4月發佈其語言大模型「通義千問」,
此前阿里雲智能助手「聽悟」亦接入「通義千問」,目前升級版的「
AI黑客松大賽激發創新
ModelScope社區還主辦了中國首屆AI黑客松,以促進A
目前超過300支參賽隊伍中已有56支進入決賽,
周靖人表示:「透過舉辦競賽和社區活動,
請注意!留言要自負法律責任,相關案例層出不窮,請慎重發文!