最近,Pokémon Go 成功吸引了人們的注意,這款遊戲的受歡迎程度,讓大家都覺得AR 遊戲未來有強大的潛力。但是,只要在現實影像中出現卡通人物就是AR嗎? AR 與現實世界的互動遠不止於此。 AI 圖像識別技術公司 Cortica 的聯合創始人兼CEO Igal Raichelgauz 發表了對未來 AR 的看法。
「真正的 AR 需要電腦視覺和對現實環境的動態映射。」他表示,電腦所設計出來的物體,必需要與現實環境有所互動,才是真正的AR。而Pokémon Go 中的角色只依賴 Google Maps 中的固定緯度和經度。如果在遊戲中應用真正的 AR 技術,即時深度映射和物體識別功能會讓遊戲角色與現實世界互動,而不是將他們放在不協調的遊樂區之外。
真正的 AR ,讓 AR 技術真正發揮作用的關鍵是利用 AI 技術的圖像識別技術,這種技術可以進行「無監督學習」,人們可以使用裝置即時觀看任何圖像和影片,並儘可能的理解內容。
當前 AI 的侷限性
在瞭解「無監督學習」之前,首先讓我們來瞭解一下目前的狀況。Google、IBM 和 Facebook 等大公司一直致力於開發、實踐 AI 技術,改善圖像識別能力,但是他們都有缺陷,當前該領域的大部分工作主要集中在「深度學習」技術上。
深度學習提供了利用大量學習運算的能力,但是有兩個重要的缺陷:
第一,當深度學習系統觸達第1000個運算層之後,運算能力達到頂峰,但是沒有繼續形成規模的能力。
第 二,機器學習需要讓人們進行數百個小時的指導,我們將其稱之為「監督學習」。電腦科學家會修正錯誤的答案,最終該系統會從錯誤中進行學習。針對特定的資料集,這是有效的,例如,回答智力競賽節目中的問題,或者玩棋盤遊戲,但是它無法被應用到不斷變化的環境中,例如自然界。
「人性化」 AI
我們需要考慮的一個關鍵字是:自然。將深度學習應用到 AR 中不太適用,因為這是讓人工系統瞭解自然環境。當然,這些任務對人類來說並不是困難。為了確保電腦可以精確地理解環境,這需要一個過程,就像人類的自然進化一樣。最新的腦部研究表明,無監督學習才是答案。
無監督學習與深度學習不同,因為它不需要人類的參與,不需要給它一定的資料集,從問題中得到正確或錯誤的答案——「這是一隻貓,這不是一隻貓」,無人監督的學習系統會基於每張圖片相同/不相同的特點,分析出上千個特徵,包括顏色、形狀、複雜組合,等等。
真正由 AI 導向的 AR 可以做什麼?
透過對此更加深入的瞭解,AI 導向的 AR 遊戲將會把虛構角色的活動和遊戲設定整合到自然場景中。但是遊戲只是冰山一角。
AI 導向的 AR 是強大的技術,可以顛覆無數行業。例如,消費者很快就能很好地利用自己手機和其他裝置中的照片。想像一下,內嵌的AI助手可以自動管理圖片和影片,在一毫秒的時間內進行精確的搜索,根據圖片的主題進行分享推薦。數百萬張被遺忘的照片突然獲得了新生,可視化搜索的潛力被釋放。
透過無監督學習進行圖像識別可以讓自動駕駛汽車的安全性成指數倍增長。汽車可以完全看清行人,完美辨別道理障礙。
在醫療領域,手術過程中,醫生可以獲知更即時的訊息,並與上百個相關的操作進行對比,透過這種「世界級」的解決方案指導醫生進行操作。
AR 是一種趨勢,但是只有當這種技術完美無瑕地整合在社會中時,才能發揮更大的作用。Pokémon Go 遠沒有達到這種水平,但是這種技術很快就會被使用。透過非監督學習,可以讓一個虛擬的皮卡丘藏在一棵真正的樹下,這種突破將會從根本上改變 AI、AR 在世界中的執行方式。
- 本文來自:venturebeat.com
請注意!留言要自負法律責任,相關案例層出不窮,請慎重發文!