「蒙娜麗莎」因為其神秘的微笑而聞名於世。最近在人工智慧的幫助下,這張著名的臉展示出了一系列令人震驚的新表情。
在一段YouTube影片中,分別有三個不同片段展示了緊張不安的蒙娜麗莎動嘴唇和轉頭時的樣子。影片中的蒙娜麗莎是由卷積神經網路創造的,卷積神經網路是一種像人腦一樣處理訊息的人工智慧,可以用來分析和處理圖像。
研究人員對該演算法進行了訓練,使其能夠理解臉部特徵的一般形狀及其相互之間的關係,然後研究人員將這些訊息應用於靜止圖像上。最終,一幅單一的畫面變成了一段真實的影片。
來自斯科爾科沃科技研究所和三星人工智慧中心(莫斯科)的工程師葉戈爾‧札哈羅夫在這段《蒙娜麗莎》的影片中解釋說:「人工智慧『學習』了三位模特兒的臉部運動資料集,並且產生了三個截然不同的動畫。雖然在這三個影片片段中人們仍然能辨認出蒙娜麗莎,但三位模特的外貌和行為的變化賦予了這些『活生生的肖像』以鮮明的個性。」
札哈羅夫和他的同事還根據20世紀的文化偶像,如阿爾伯特‧愛因斯坦、瑪麗蓮‧夢露和薩爾瓦多‧達利的照片製作了動畫。研究人員在5月20日發表在arXiv雜誌網路版上的一項研究中描述了他們的發現,但是這項研究沒有經過同行評審。
研究人員寫道,這類影片被稱為deepfakes,製作這樣的原創影片並不容易。人的頭部具有幾何複雜性和高度的動態性,並且頭部的3D模型有「數千萬個參數」。
更重要的是,這項研究表明,人類的視覺系統非常善於識別3D模型人腦中的「哪怕是很小的錯誤」。一些看起來很像人類但並不完全屬於人類的東西,會引發一種「恐怖谷效應」(uncanny valley effect),並給人們帶來深深的不安感。
人工智慧之前已經證明,製作令人信服的deepfakes是可能的,但是需要從多個角度拍攝目標對象。在這項新研究中,工程師們將人工智慧引入了一個非常大的資料集,裡面有顯示人臉活動的參考影片。科學家們建立了適用於任何一張臉的臉部地標,來教授「神經網路」人臉運動的一般規律。
然後,他們訓練AI使用參考表達式來映射源特徵的移動。研究人員稱,這使得人工智慧即使只有一張圖片可用,也能創建deepfakes。
科學家們寫道:「更多的源圖像在最終動畫中提供了更詳細的結果。在一項使用者研究中,一段用三十二張圖片而不是一張圖片製作的影片達到了堪稱完美的真實性。」
請注意!留言要自負法律責任,相關案例層出不窮,請慎重發文!