2015.11.12 12:00

Google實現機器「深度學習」:Gmail自動回信、Google相簿聰明分類全靠它

ADVERTISEMENT

Google在東京舉辦了亞太地區媒體年會,這次的主軸鎖定在「機器學習」上,揭露了最近這半年,Google推出了許多看似很神奇的服務, 像是幫你自動回信的Smart Reply、Google相簿中幫我們分辨照片中的人、事、物的自動機制,背後全都靠的是「機器學習」或是更進一步的「深度學習」。

 「深度學習」不是「人工智慧」

今年Google媒體年會的主題是「Magic in the Machine」,顧名思義講的就是隱藏在機器背後的秘密。而一開始Google亞太地區行動通訊的副總裁Mike Nelson就上台表示,過去很多人以為Google的一些服務都是人工智慧的結果,其實他覺得應該澄清一下,事實上大多數Google的服務進行的其實是「深度學習」,而非「人工智慧」。

ADVERTISEMENT

他舉例,以IBM的超級電腦「深藍」與世界棋王比賽下棋,透過演算法來判斷棋子該下哪裡,那是人工智慧。不過「深度學習」指的則是人類因為有很多重複性的工作要做,但是人類並不想做,因此讓機器學習人類所不想做、重複性的工作,用機器來代勞,這才叫「機器學習」。

那麼,什麼又是「深度學習」呢?深度學習指的是當人類在網路上累積的數據越來越多,那麼機器自然就可以透過現有的大數據來判斷,進而預設人類日常生活中有哪些工作需要自己做,有哪些重複性的工作可以用機器代勞。比方說,垃圾郵件的篩選。傳統垃圾郵件的篩選方式是透過預設的垃圾郵件黑名單,搭配解析信件的某些內容來判斷。而現在的機器學習的方式是,他先學習我們怎麼判斷哪些信是垃圾郵件,哪些不是?機器就要學習這些規則。

當然,不可否認的,「深度學習」與「人工智慧」之間也有很大的重疊的地帶,但是基本上來說,兩者依然是不同的東西。

ADVERTISEMENT

 

什麼是機器學習?

接下來在Google 擔任人工智能、計算神經科學、及可量化機器學習的研究員 Greg Corrado 博士來講解目前Google的機器學習的相關應用。

Greg Corrado說明,Google 目前透過兩個方面來應用機器學習技術:強化現有的產品服務(如:Google 搜尋裡的排名建議)、提供更先進更新穎的產品服務(如:Gmail 裡的 Smart Reply 智慧回覆功能)

ADVERTISEMENT

Greg Corrado表示,雖然看起來結果好像一樣,但是背後的原理不同。機器學習的原理是這樣的,我們熟悉的機器運作方式是輸入(input)後進入機器設定的模型(model)後得到產出(output)或預測結果(predictions)。

ADVERTISEMENT

比方說,如果你是篩選垃圾郵件的程式,那麼你裡面就會有一個過濾垃圾郵件的模型,這個模型是基於黑名單、篩選規則而建立的。但是這種人工設計的模型過於單一,難免有缺陷,因此產出就不見得準確。

而機器學習就是透過類神經網路的技術,讓模型的設定更聰明、涵蓋更多變數,就是機器學習的重點。理想的機器學習模式是逐步改進的,每次結果都與真實結果比對,然後再來逐次改進。

 

有哪些Google服務用到了深度學習(Deep Learning)?

 透過深度學習,電腦可以立即分析出輸入的項目,快速且自動進行判斷結果,甚至給予下一步的建議。

這套系統的神奇之處在於,它可以在事先沒有告訴系統「貓的特徵」的條件的前提之下,只要提供給他夠大夠多的圖像,就可以自行學習總結出「貓是什麼」的概念。採用的就是類神經網路的這種技術,主要就是採用分層機制工作,神經網路的最底層可偵測圖像顏色變化,再上一層則可識別特定類型的輪廓。在增加若干後續分析層之後,系統不同的分支會為不同物件生成檢測方法。

因此,同樣的系統、同樣的方法,你也可以讓它來判斷什麼是碎紙機、什麼是狗、什麼是考克力糖,就算是事前你沒有給他任何資訊都沒問題。

或許你會想問:為什麼是現在?畢竟深度學習這個理論已經存在很久了,為什麼現在才又提出來呢?Greg Corrado表示,主要是因為現在可以支援深度學習的硬體條件已經成熟。舉例來說,在2012年, Google X Lab 要實現這樣的一個系統,採用了一千台電腦架成「 Google Brain」,才實現這種能力。

 

Greg Corrado說明目前 Google 產品中應用到深度學習的案例:

● 目前Gmail 已經可以自動判斷約99%的垃圾郵件

●如果你在使用GoogleNow的話,你會發現最近這一年來Google Now的語音辨識已經相當準了,而且這不是錯覺,Google 語音辨識功能的錯誤量已經減少逾20%。傳統的方式,是我們用人工去糾正、建立語句轉換。而現在則是透過不斷糾正的方式,讓它學習。

● Google 相簿已經可以讓使用者透過標籤搜尋找到相關的照片(像是輸入:海洋,也許就會出現前幾天在海邊拍的海景照)

● 即刻看到結果的Google 翻譯,甚至結合拍照功能。

● Gmail 的Smart Reply 功能,自動偵測對方寄來的郵件內容,進而提出簡單的回覆建立(像是:對不起,我沒有空參加這個活動)。

 

Google免費提供「深度學習」開發工具

Greg Corrado表示,各個團隊用來開發深度學習,使用的是Tensor Flow這個工具。而就在前兩天, Google 正式宣布了 Tensor Flow 開放源碼,讓更多人可以受惠於Google 研發許久的機器學習技術。

Google以Apache 2.0授權模式開放TensorFlow函式庫、相關工具,以及說明文件、範例等資源,並邀請開發人員透過TensorFlow.org加入參與計畫。

Greg Corrado強調,只有越來越多開發者都使用到機器學習,那麼我們的生活才會有越來越多的服務變得聰明。Google想要建立的是一套系統,可以靈活的供機器學習來使用。而且開發者可以將這個系統用在實際的產品中,這個工具與GOOGLE用來開發自家深度學習軟體的工具是完全一樣的。

ADVERTISEMENT