談到機器學習的發展,Google 絕對是要角之一,近日 Google 在官方部落格上發表了一篇文章,談到他們如何利用機器學習將普通的 Google 街景照片變成一張張出色的風景照,以後修圖工作或許交給電腦自動執行就好了。
把平淡無奇的照片修成有如專業攝影師拍出來的等級,說實在並不難,任何一位學過修圖技巧的人應該都能辦到。但若是由電腦來修,就會有很多問題了,首先就是「美」的定義,人類或許可以輕易的定義一張照片好不好看,但對於電腦來說,照片不過就是解析度、像素、色彩的總和,電腦沒有具備「審美觀」或所謂的「主觀意識」。
為了讓機器學習的應用更上層樓,Google 要挑戰讓電腦也能具備審美的能力,運用深度學習系統,讓電腦也能創造出藝術性的內容,Google 設計出的這個程式,從全球各地超過 4 萬張的街景照片尋找素材,地區涵蓋了像是阿爾卑斯山、班夫國家公園、大索爾、黃石國家公園等等。
▲義大利 Parco delle Orobie Bergamasche 公園
▲加拿大賈斯珀國家公園
首先要做的就是「模仿」,正因為電腦沒有具備美感,所以要先讓電腦知道哪些圖像是美的、好看的,所以 Google 讓系統模仿專業攝影師的視角,從 Google 自家的街景照片當中挑選出構圖較好的照片,然後進行後製。
至於電腦要如何修出讓專業攝影師贊同的風景照?如果讓電腦直接用軟體自動修圖,修出來的成果可能會太假,像是太過飽和;如果教導電腦所謂的美學,還有修出好照片的原理,這又牽扯到更多技術面,而且會相當難以克服。
所以 Google 決定採取的方式就是讓程式「欣賞」專業攝影師的大作,然後從各個角度去比較好看跟不好看的照片,像是飽和度、對比度、亮度等等,將修圖的步驟拆解開來,一一去進行比對、修正,然後再全部結合起來,就大功告成。
▲電腦自動將 Google 街景的全景圖 (a) 裁剪成 (b),然後經過飽和度、HDR 強化之後變成 (c),最後利用遮罩製作出更自然的效果,也就是 (d)。
聽起來好像很簡單,但事實上 Google 必須讓電腦程式進行一連串的訓練,像是要比較「負面範本」,也就是讓系統辨別好看與不好看的照片,將人們定義中的好看數據化,從而讓系統了解要將亮度、對比度、飽和度等數值調整到一定的程度,並與負面範本對比,才能製作出仿專業級的成果。
Google 表示,此項技術未來有望可以加入到智慧型手機的相機當中,讓使用者可以拍出更自然、好看的照片。
▲加拿大賈斯珀國家公園
▲瑞士因特拉肯
資料及圖片來源:Google Research Blog
請注意!留言要自負法律責任,相關案例層出不窮,請慎重發文!