NVIDIA提出GAN的全新訓練方式,訓練資料數據可減少10到20倍!

NVIDIA提出GAN的全新訓練方式,訓練資料數據可減少10到20倍!

ADVERTISEMENT

NVIDIA的研究人員創造了一種增強方法來訓練生成對抗性網路(GANF),與先前的方法相比,這種方法需要的數據量相對更少。 

NVIDIA的這種GAN網路,可用於風景畫等藝術作品的創作,還可製作一些用於視訊會議的作品。(GAN是人工智慧的一種形式,它將產生器網路與鑑別器網路相匹配,以創建圖像或影片。) 訓練GANs可能需要10萬張以上的圖像,但論文「利用有限數據訓練生成對抗性網路」中提出了一種稱為自適應鑑別器增強(ADA)的方法,利用這種方法訓練GAN,可使需要的數據減少10到20倍。

「小型數據集的關鍵問題是:鑑別器會產生過擬合,訓練開始發散,使得產生器的回饋變得毫無意義『論文中這樣描述』通過在多個數據集上進行訓練,結果證明,現在只使用幾千張圖片就可以取得好的結果,而Style GAN2的訓練結果則需要與更少的圖像匹配。」

今年早些時候,來自Adobe Research、MIT和北京清華大學的研究人員詳細介紹了GANS增強的另一種方法DiffAugment。

NVIDIA副總裁,圖學研究員David Luebke聲稱,做過實用數據科學的人都知道:大部分時間都用在收集和管理數據上,這通常稱為ETL管道:提取、轉換和加載。

他說:「僅這一項工作就需要大量實地數據科學人員,我們認為這種方法非常有用,因為你無需巨量的數據,也能獲得有用的結果。」

他說:「對於那些沒有大量時間對數據進行標註的數據科學人員來說,這一點變得尤為重要。」

論文的作者認為:減少數據約束可以授權研究人員檢查GANs的新用例。除了創造人或動物的假照片外,研究人員認為GAN可能在醫學成像數據中得到應用。

「如果有一位專門研究某一特定領域的放射科醫生......讓他或她坐下來為5萬張照片貼上標籤可能不太實際......但是讓他們為1,000張照片貼標籤似乎比較可能的。這的確降低了數據科學家需要投入的數據管理的工作量,進而方便了研究工作,「Luebke說。

在世界上最大的年度AI研究會議——NeurIPS會議上,作為神經訊息處理網路的一部分,本週發表了一篇詳細介紹該方法的論文。

「用有限的數據訓練生成對抗性網路」並不是唯一與GAN相關的論文。另一篇研究論文介紹了鑑別器驅動的潛在抽樣(DDLS),利用CIFAR-10數據集進行評估時,DDLS提高了GAN的性能。這篇論文是由MILA魁北克人工智慧研究所和Google大腦研究人員合作撰寫,作者包括Yoshua Bengio和Hugo Larochelle,蒙特利爾Google大腦小組組長,NeurIPS會議常務主席。

bigdatadigest
作者

大數據文摘(bigdatadigest)成立於2013年7月,專注數據領域資訊、案例、技術,在多家具有影響力的網站、雜誌設有專欄,致力於打造精準數據分析社群。

使用 Facebook 留言
發表回應
謹慎發言,尊重彼此。按此展開留言規則