ADVERTISEMENT
Google在今年Google I/O大會發表的即時通訊工具,它是款整合溝通表達、Google助手 以及安全性的創新工具,而其創新的功能之一就是能夠自動辨識照片,並提供回覆建議。就讓我們瞭解一下這項功能運作的原理,並想想這種功能會給我們什麼影響。
透過機械學習從大量圖片中找尋關連
Allo的基本使用與一般常見的Line、Facebook Messenger差不多,但是它的內部卻藏有許多Google研發的新技術,這邊要討論的便是自動回覆建議功能,該功能可以自動分析對方傳來的圖片,並顯示回覆建議,以利使用者可以方便選取,加快回覆訊息的速度。
這個功能最主要的技術核心,分別是影像識別與深度學習,前者個功用是讓電腦瞭解圖片的主題為何,後者則用於強化產生回覆內容。
ADVERTISEMENT
影像識別的部分採用Google的Machine Perception(意為機器理解力)團隊所開發的辨識技術,能夠在深度學習的輔助下,將圖片與真實語言中的詞彙建立關連,簡單地說就是可以自動為圖片標註「人」、「車輛」、「動物」、「食物」等標籤。
至於深度學習方面,則是透過稱為Expander的大型電腦平台(Large-Scale Graph-Based Semi-Supervised Learning Platform)進行半監督式學習(Semi-Supervised Learning,利用大量未標記的資料與部分已標記的資料進行訓練的模型,以解決資料量稀少及分散的問題)。當照片經影像識別處理、建立標籤之後,深度學習系統就會從大量圖片中分析彼此的關連性,並自動建立新的標籤。
舉例來說,當義大利麵被標註「好吃」,而細扁麵被標註「美味」時,即便義大利麵與細扁麵彼此間沒有具關連性的標籤,但是系統會自行因為好吃與美味的關連,而為圖片建立新的標籤,如此一來細扁麵也會產生好吃標籤。當系統中有非常大量的圖片與標籤時,學習的成效就會趨勢顯著,讓回覆建議更加精準。
ADVERTISEMENT
▲Allo的回覆建議功能展示,它不但能處理文字訊息,也可以對圖片進行處理。
ADVERTISEMENT
▲收到小寶寶的照片時,Allo會產生「哇」、「好可愛」、「可愛的寶寶」等回覆建議。
▲當義大利麵與玫瑰花被準確識別後,Allo就能產生「我喜歡義大利食物」或「喜歡玫瑰花」等回覆建議。
ADVERTISEMENT
▲Allo也能對場景、情境進行分析,例如在畢業典禮的照片產生祝賀或鼓勵的回覆建議。
▲原本義大利麵(上方2款麵食)被標註「好吃」(紅色標籤),而細扁麵(下方1款麵食)被標註「美味」(藍色標籤)。經過這套深度學習系統的運作後,就能自動為細扁麵與好吃建立關連。
那,這是你的回覆還是Allo的回覆?
雖然Allo能夠產生回覆建議的功能相當方便,但是筆者不免懷疑它會對人們產生的負面影響。
由於筆者近期正巧前往旅遊,在Facebook分享照片時,隨手無病呻吟地裝了一下文青寫下旅遊心情,覺得反芻情景所寫下的文字別具意義。但是由於Facebook提供了方便的按讚功能,所以許多人在閱讀文字時不一定會停頓、咀嚼,反而只是囫圇吞棗似的以按讚表示自己已經看過,如此一來便少了回覆之後可能會產生的互動與交流。
而Allo的回覆建議雖然比按讚「精緻」一點,但它畢竟不是使用者親自對圖片所產生的共鳴,而只是機器與程式自動執行的結果。這種少了人性的回覆,不知道對朋友間的情誼是否有所幫助。
延伸閱讀:
ADVERTISEMENT