在 Google I/O 2019 上,除了面向消費者的功能改進和開發者的工具革新,Google 將大會的一個重點也放在了如何用 AI 解決人類面臨的棘手難題上。
美國工程界的最高學術團體美國國家工程院 (National Academy of Engineering) 於2008年發佈了21世紀人類面臨的14大工程挑戰。而 Google 的科學研究領袖傑夫·迪恩(Jeff Dean)說,他所領導的 Google AI 正在著手解決這些挑戰。
如果這些挑戰背後的難題不得到一定程度的緩解,很可能意味著人類將無法健康地延續到22世紀。這些難題在世界各地有所體現,也面向各行各業,但是 Google AI 都在用自己擅長的手段去嘗試攻克它們或者貢獻一份力量。
Google AI 擅長的,正是深度學習
為什麼深度學習可以用於解決能源、交通、診斷、醫藥、安全等等諸多方面的問題,成為泛用的科學探索工具?
Jeff Dean 認為,這是因為深度學習可以從原始、異構、攜帶噪音的資料開始學習,即便開發者不具備特別領域知識,也可以開發出達到甚至超過領域內最高水準的神經網路。
而且,機器學習技術日新月異,現在每天發到 ArXiv 上的論文就有90篇;深度學習的技巧也層出不窮,使得神經網路能夠掌握越來越多過去公認只有人類才能掌握的複雜能力。
現在,人類不得不應對重大的工程挑戰,並尋求在本世紀內解決他們。Jeff Dean 認為,深度學習可以成為很好的工具。
維護和改進城市基礎設施
交通是城市基礎設施的重要部分,也是隨著人口增長和城市化加劇面臨壓力最大的領域之一。社會在變化,而道路通常是一成不變的。因此,交通在21世紀工程難題裡尤為顯著。
Google 採取的切入角度是提高道路交通安全和效率,而除了開車放下手機之外,最有效的方法可能就是自動駕駛。
Waymo 自動駕駛汽車從研發到今天已經將近10年,截至去年已經累計行駛800萬英里,並且在全球所有自動駕駛試驗者當中取得了最低的事故率。
Jeff Dean 指出,深度學習是 Google/Waymo 取得這一成就的功臣,讓自動駕駛系統可以整合併學習來自不同感應器的原始資料,繪製高精度地圖,「看懂」周圍的車輛、行人和障礙物都在哪裡,甚至可以預測其他道路參與者的行進方向,輔助自動駕駛汽車做出決策。
他介紹,現在 Waymo 在亞利桑那州已經有超過100輛測試自動駕駛汽車,可以在沒有安全駕駛人員的條件下載客前往目的地。許多業內人士都認為,理論上如動駕駛汽車佔一個地區總車輛的比例越高,地區的事故率越小、交通效率將越高。
除了自動駕駛之外,機器學習也可以透過其它方式提高交通效率。比如在摩托車流行的東南亞國家和地區,Google 在地圖導航加入了「機車模式」,讓系統能夠彙總多元的資料來源,為摩托車駕駛者推薦捷徑、小道,從而避免高峰擁堵。
用深度學習帶來醫療訊息革命
作為糖尿病的併發症之一,糖尿病視網膜病變 (Diabetic Retinopathy, DR) 侵蝕著患者,一般患病10年才開始出現病變,導致失明。這一病症實際上可預防,有經驗的眼科醫師往往能透過視網膜眼底掃瞄觀察到先兆。然而,以印度為例,全國存在大約 12 萬名眼科醫師的缺口,DR 患者往往無醫可投,導致大量人口失去視力。
Google AI(原 Google Research)的研究員莉莉‧彭博士帶領團隊,基於卷積神經網路搭建,利用眼科專家標記好的掃瞄圖作為訓練資料,最終得到了一個 DR 預估模型。
此前報導過這項技術時,該模型在發現症狀的敏感度 (98.8) 和判斷症狀的準確性 (99.3) 上,都比人的得分要高(在統計學上這個得分叫做 F-score,普通眼科醫生的分數是 0.91,模型 0.95)。
好消息是,Jeff Dean 告訴我們,經過兩年的發展,現在新模型更進一步,得分和專門的視網膜眼底醫師持平。
這還沒完,該項技術的潛力遠不止診斷 DR。Jeff Dean 透露,莉莉‧彭的團隊在這個模型上取得了更卓越的科學成就。正是因為深度學習的泛用型強,現在他們可以用同樣的眼底掃瞄圖像,來預測性別、年齡、血壓、骨齡以及其他病症的發病幾率,並且準確度極高。
這在醫療訊息學上是重大的突破,因為它能夠補充因為醫療條件限制未能獲取的關鍵訊息。最短期和直接的效果就是為眼科醫生的診斷和治療推薦提供更多可參考的資料,長期來看還能提前預測和診斷更多病症(比如心血管疾病)。儘管這並非專業的診斷,但仍足以提前 5 年甚至 10 年,拯救現在的普通人,未來的患者。
通用 AI:打造科學突破的工具
以青黴素和X光為例,許多知名的科學突破都存在一定的偶然性。即便如此,人們也一直沒有停止試圖發現讓科學突破持續發生的「永動機」。
Jeff Dean 指出,在更強大運算力的加持下,深度學習可以更方便地投入到更多領域當中。因此,深度學習有成為這樣工具的潛力。因為正如前述,深度學習的技巧層出不窮,讓神經網路掌握越來越多過去公認只有人類才能掌握的複雜能力。
以 TensorFlow 為代表,這一由 Google 主導並開源的深度學習項目,現在正在被農業種植養殖、工業生產、互聯網、醫療金融等多個行業使用,在三大產業中持續促成效率進步。一個例子在歐洲的一座農場,農場主運用了 TensorFlow 搭建養殖監控技術,透過鏡頭、動作捕捉等感應器時刻追蹤和分析牲畜的健康狀況和運動軌跡,顯著提高了出欄率。
至於科學突破,前述的視網膜眼底掃瞄也可以作為一個例子。
前年,Google 宣佈了神經架構搜索 (NAS)/AutoML 技術,可以比喻為「用神經網路設計和訓練神經網路」,在包括圖像辨識在內的一些領域超過了手調神經網路的效果。
但是現在,Google AI 已經不滿足於已經取得的成就。Jeff Dean 說,他們正在思考一種全新的神經網路形式:一個巨大的、少量啟動的模型 (a large model, but sparsely activated)。
這種新的神經網路,具備的參數之多,和現有神經網路相比可能是幾何級的。但是,當它處理不同任務時,只需要啟動少數路徑上的節點,並不需要全部啟動。這樣設計的目的,是讓一個神經網路能夠執行多種不同的任務——少則數百,多則上百萬種,以此顯著降低神經網路設計、搭建和訓練的運算量和耗時,實現更強的通用性。
Jeff Dean 表示,他所描繪的這個新神經網路,確實和人們曾經熱議但認為短期內不會實現的「通用人工智慧」(general AI) 些許相似。但是他強調,Google AI 的主張是即便在這個新的巨大且少量啟動的網路內,訓練仍然是自我監督的。
2017年,他和幾位同事(包括 Geoff Hinton、Quoc Le等 Google AI 頂級學者)以及外部研究夥伴共同提交了這一方向的首篇論文,名為《Outrageously Large Neural Networks: The Sparsely-Gated Mixture-of-Experts Layer》,呈現了一個超過1370億參數,擁有數千個子網路的巨大神經網路架構,在語言建模、機器翻譯等場景下,用更少的運算量達到了對當前最高水準神經網路的超越。
Jeff Dean 展示了 Google AI 對於這一技術的未來構想:除了最佳化網路結構之外,Google 可能還將開發新的、面向該網路結構最佳化的機器學習超級電腦(就像他們為 TensorFlow 設計了 TPU 那樣。)屆時,新的運算範式將為 Google AI 解決21世紀偉大工程挑戰帶來更多幫助。
「深度學習正在幫助我們挑戰很多重大的難題,它會在科學突破和人類發展的許多領域做出巨大貢獻。」Jeff Dean 表示。
- 本文授權轉載自Pingwest
請注意!留言要自負法律責任,相關案例層出不窮,請慎重發文!