NVIDIA提出GAN的全新訓練方式，訓練資料數據可減少10到20倍！

NVIDIA的研究人員創造了一種增強方法來訓練生成對抗性網路（GANF），與先前的方法相比，這種方法需要的數據量相對更少。

NVIDIA的這種GAN網路，可用於風景畫等藝術作品的創作，還可製作一些用於視訊會議的作品。（GAN是人工智慧的一種形式，它將產生器網路與鑑別器網路相匹配，以創建圖像或影片。）訓練GANs可能需要10萬張以上的圖像，但論文「利用有限數據訓練生成對抗性網路」中提出了一種稱為自適應鑑別器增強（ADA）的方法，利用這種方法訓練GAN，可使需要的數據減少10到20倍。

「小型數據集的關鍵問題是：鑑別器會產生過擬合，訓練開始發散，使得產生器的回饋變得毫無意義『論文中這樣描述』通過在多個數據集上進行訓練，結果證明，現在只使用幾千張圖片就可以取得好的結果，而Style GAN2的訓練結果則需要與更少的圖像匹配。」

今年早些時候，來自Adobe Research、MIT和北京清華大學的研究人員詳細介紹了GANS增強的另一種方法DiffAugment。

NVIDIA副總裁，圖學研究員David Luebke聲稱，做過實用數據科學的人都知道：大部分時間都用在收集和管理數據上，這通常稱為ETL管道：提取、轉換和加載。

他說：「僅這一項工作就需要大量實地數據科學人員，我們認為這種方法非常有用，因為你無需巨量的數據，也能獲得有用的結果。」

他說：「對於那些沒有大量時間對數據進行標註的數據科學人員來說，這一點變得尤為重要。」

論文的作者認為：減少數據約束可以授權研究人員檢查GANs的新用例。除了創造人或動物的假照片外，研究人員認為GAN可能在醫學成像數據中得到應用。

「如果有一位專門研究某一特定領域的放射科醫生......讓他或她坐下來為5萬張照片貼上標籤可能不太實際......但是讓他們為1，000張照片貼標籤似乎比較可能的。這的確降低了數據科學家需要投入的數據管理的工作量，進而方便了研究工作，「Luebke說。

在世界上最大的年度AI研究會議——NeurIPS會議上，作為神經訊息處理網路的一部分，本週發表了一篇詳細介紹該方法的論文。

「用有限的數據訓練生成對抗性網路」並不是唯一與GAN相關的論文。另一篇研究論文介紹了鑑別器驅動的潛在抽樣（DDLS），利用CIFAR-10數據集進行評估時，DDLS提高了GAN的性能。這篇論文是由MILA魁北克人工智慧研究所和Google大腦研究人員合作撰寫，作者包括Yoshua Bengio和Hugo Larochelle，蒙特利爾Google大腦小組組長，NeurIPS會議常務主席。

資料來源：Nvidia researchers devise method for training GANs with less data
本文轉載自大數據文摘