面對ChatGPT 蘋果到底該發展自家的Siri Copilot,還是推倒重來?蘋果自己也在矛盾中

面對ChatGPT 蘋果到底該發展自家的Siri Copilot,還是推倒重來?蘋果自己也在矛盾中

微軟投資 OpenAI,推出新 Bing,Google 推出 Bard,Adobe 推出了 FireFly,亞馬遜推出 Amazon Titan,隨著 ChatGPT 的走紅,矽谷大公司的 AI 工具或者助手,瞬間都迸發了出來。 

只有地處加州一隅的蘋果,在外界看來,彷彿是一個沒有被 AI 打擾的世界。 

蘋果在想什麼:把Siri語音助手結合AIGC

經歷 AI 的瘋狂三月後,大小公司前赴後繼的切入 AIGC 領域,他們都會標上 Beta 測試版,以及需要經歷一個 waitlist 的階段。 

面對ChatGPT 蘋果到底該發展自家的Siri Copilot,還是推倒重來?蘋果自己也在矛盾中

他們最終可能會出錯,也可能會答非所問,甚至也可能引發一次輿論高峰,但矽谷和我們仍然樂此不疲的參與其中。 

相對來說,蘋果對 AIGC 始終保持沉默,高層、員工都沒有對外發表過蘋果對其真實看法。 

蘋果一向很注重維護自己的形象和公司品牌,他們很少對外公佈不成熟的產品或者技術。 因此,這也說明,對於新技術為何蘋果總是比別的公司廠商慢一拍。 

蘋果儘量避免把新技術運用到產品中時,出現水土不服的現象。 

目前 AIGC 行業的產品,大多還是圍繞著網頁對話方塊,殺手級應用目前還處於空白階段。 對於專注在產品上的蘋果不予置評,其實也說得通。 

不過,根據 the information 那裡獲得的消息來看,蘋果的工程師正在醞釀把 LLM 大語言模型與 Siri 結合,推出更聰明的 Siri,並順理成章的運用到明年的 iOS 當中。 

就像 2011 年那樣,蘋果首次公佈智慧助手 Siri,並與 iPhone 4s 一同上市,成為當年 iPhone 的一個重大功能性升級。 

曾經是人工智慧代名詞的Siri助手,技術仍停留在2011年 

以現在的眼光來看,蘋果在晶片上加入了神經引擎,將 SoC 晶片稱之為「仿生」,將各種人工智慧模型、演算法運用到拍照、生物識別、書寫等方面。 

這對於使用體驗的大幅最佳化和提升,往往很難讓人留意,蘋果對於 AI 的運用相當低調。 

但在 2011 年,Siri 是作為蘋果最高調的人工智慧技術亮相。 

Scott Forstall 

直到現在我依然記得, Scott Forstall 在介紹 Siri 時表示,Siri 能夠理解自然語言,不需要使用者記住特定的格式和語法,也可以根據使用者的使用習慣進行定製。 

後續上線的宣傳片裡,Siri 也真正的成為了一個永遠正確響應回應,以及頗具智慧頗具人味兒的手機內建助手。 

面對ChatGPT 蘋果到底該發展自家的Siri Copilot,還是推倒重來?蘋果自己也在矛盾中

只是,Siri 在 2011 年後,其技術迭代彷彿被停滯。十幾年過去,它仍然還遵循著 2011 年的「天真」回答。 當人們不斷被其他公司的更先進的語音助手更新認知的時候,Siri 就顯得有些笨拙,和過於可愛了。 

尤其是 Siri 目前已經覆蓋到蘋果幾乎所有的裝置,iPhone、iPad、Mac 甚至是 AirPods,Siri 略顯老成的處理和回答方式,就更顯得它有些落伍。 

甚至蘋果內部也對 Siri 失望,蘋果開發 XR 裝置的團隊,就不太想在 XR 裝置上用 Siri 控制裝置和功能,理由就是它不夠聰明。 

為此,XR 裝置的負責人 Mike Rockwell 也曾考慮找個備用方案以替換掉 Siri 的語音控制,不過最終並沒有成功。 

傳聞中的蘋果 XR 頭戴式裝置,仍然會與蘋果其他裝置類似,可以用 Siri 進行簡單的控制,當然,如果你想的話,也可以跟它進行簡單的對話。 

重金收購機器學習初創公司 Laserlike,三位創始人卻「出走」Google

發佈 Siri,被認為是智慧型手機歷史上的一個轉折。在 Siri 之後,幾乎所有的智慧型手機廠商都會為其產品推出一個類似的智慧助手,以免落伍。 

面對ChatGPT 蘋果到底該發展自家的Siri Copilot,還是推倒重來?蘋果自己也在矛盾中

而對於蘋果,2010 年花費了 2 億美元收購了 Siri Inc.,並在一年後把 Siri 整合到 iPhone 裡頭。 在此之後,蘋果也組建了一個 Siri 智慧助手團隊,不過在 2011 年發佈至 2018 年期間,Siri 團隊陷入了迷茫,內部管理和大方向也出現了一些爭論。 

John Giannandrea 

蘋果的解決方案是「請高人」,2018 年從 Google 挖來了 John Giannandrea,成為蘋果負責人工智慧和機器學習戰略的高級副總裁。 此前他在 Google 負責搜尋業務和人工智慧,幾乎可以算是 Google 人工智慧領域的資深專家。 

有了 John Giannandrea 的加入,蘋果想依靠他的經驗,逐步改善 Siri 的現狀,幫助 Siri 趕上競爭對手。 John Giannandrea 也為 Siri 團隊帶來了類似 Google 的工作氛圍,並面對蘋果高層需要 Siri 立竿見影的變化時,他會用「爬山」這個過程來解釋如何解決 AI 人工智慧領域面臨的難題。 

對於 Siri,或者說蘋果的人工智慧策略,需要有一個長遠的目標,期間每次微小的最佳化、改動,都會隨著時間的推移逐步累積,馬虎不得。 換句話說,John Giannandrea 認為蘋果在人工智慧領域底子太薄,不能急於求成。 

並且,他也說服了蘋果高層,暫時應該著重在團隊建設中,留下相關人才,並給他們更多的自由,去研究發展自己感興趣的方向。 最重要的是,John Giannandrea 顯著提升了人工智慧團隊的薪資水準,達到了行業水準。 

三板斧下來,蘋果人工智慧團隊得到了增強,引入了許多前 Google 人工智慧專家,並用 1.5 億美元收購了機器學習初創公司 Laserlike。 

面對ChatGPT 蘋果到底該發展自家的Siri Copilot,還是推倒重來?蘋果自己也在矛盾中

其三位創始人 Srinivasan Venkatachary、Steven Baker 和 Anand Shukla,後期也成為 Siri 團隊,蘋果 LLM 領域和搜尋領域的專家。 

引入 Laserlike 的目的,其實就是為了提升 Siri 的搜尋能力,而 Venkatachary 也順理成章的成為蘋果搜尋團隊的負責人。 

2019 年,蘋果就在 Siri 中加入了通過網路資訊來回答使用者的提問。Siri 的功能性正在逐步補全和增強。 

不過,這些改變更像是「曇花一現」。 

蘋果人工智慧團隊內部有著相當多的項目,有可以將 Siri 移植到 iPhone 當中的 BlackBird 項目,也有 SiriX 這種慶祝 Siri 十週年的項目。 但除了內部的競爭外,蘋果高層對於人工智慧大方向的決策過於緩慢,以及對於 LLMs 這種新技術的運用過於保守。  

2022 年秋季,Srinivasan Venkatachary、Steven Baker 和 Anand Shukla 也離開了蘋果,去了 Google。 有意思的是,Google CEO Sundar Pichai 親自招募了這個三人團隊,同時 Tim Cook 也做了挽留。 但他們認為 Google 是一個適合研究 LLM 的公司,並且也會被快速的運用到產品當中。 

如今他們正在 Google 研究如何降低大語言模型的培訓訓練成本以及如何提升精準性。 

不僅是 Laserlike 團隊,Giannandrea 親自招募的其他專家和團隊也大都離開了蘋果,理由也是因蘋果好像不太重視人工智慧方向的研究。 在 John Giannandrea 到來後,在攀爬人工智慧領域這座山峰的過程里,或許是與公司戰略大方向的不同,讓蘋果人工智慧陷入了掙扎之中。 

隱私保護反成發展語言模型障礙

隱私保護,是蘋果近來所遵循的一個公司級戰略。 在此面前,一切都要讓步,絕不妥協。 

John Giannandrea 加入蘋果,他的目標很明確,就是通過最佳化蘋果對使用者資料的使用,訓練演算法讓 Siri 變得更聰明。 因為,在 Google、亞馬遜這些公司內,通過收集分析使用者資料,改善產品演算法模型,是一件很常規的事情。 

也由於有這個過程,會讓演算法更智慧,AI 也變得更聰明。 

蘋果此前也會不記 ID 的收集 Siri 與使用者的對話資料,但做得並不專業,也沒有利用這些資料對 Siri 進行改進。 

隨著 John Giannandrea 的到來,蘋果找了許多外包公司來收集相關資料,並最終通過一個流程對 Siri 進行最佳化。 但 2019 年,《衛報》曝光蘋果外包團隊在未經同意的情況下收聽使用者與 Siri 的對話,而引起了軒然大波,尤其是一向以注重隱私的蘋果。 

面對ChatGPT 蘋果到底該發展自家的Siri Copilot,還是推倒重來?蘋果自己也在矛盾中

為此,蘋果最終用全職員工取代了外包商,並且修改了內部流程和政策,普通員工幾乎很難聽到 Siri 的對話錄音。 

如此的規定也讓人工智慧團隊更難即時最佳化和按時迭代,也算是造成目前 Siri 顯得很古典的原因之一。 

「他們所做的事情的缺點將變得越來越明顯,」華盛頓大學電腦科學教授、機器學習書籍《大師演算法(The Master Algorithm)》的作者 Pedro Domingos 就認為「他們將不得不挖掘更多的私人資料,以便與其他人更具競爭力。」 

Tim Cook 圖片來自:Bloomberg 

並且對於 Siri 的一些經常沖上熱搜奇怪的回答,也會引起 Tim Cook 的注意。會經常越過流程,直接要求 Siri 團隊修改「尷尬」的回答。 

因為隱私保護而減少資料收集,以及避免尷尬回答,進行人工修正,蘋果十分注重自己的公司形象。 

因此,即便現在蘋果有龐大的資金和資源,許多前蘋果人工智慧團隊成員也認為蘋果很難會很快的去部署基於 LLM 的 Siri。 

另外,蘋果也在 Siri 內設定了許多規則,像是詢問 iPhone 售價,會優先導流到蘋果官網,而非是直接給出答案。 蘋果並非是一個技術優先公司,他們一切的服務、技術都是為產品服務,也就是能賣出去更多的 iPhone、iPad、Mac。 

因此,在很長一段時間內,設計團隊有著相當大的話語權,他們認為產品就應該做到 100% 完美。 這種追求也延續到了 Siri 人工智慧團隊,但作為一個演算法來說,不可能 100% 精確,出錯在所難免,出錯才能更好的去最佳化相關模型。 

他們之間追求的不同,也讓人工智慧團隊的工作變得很有壓力。在 Giannandrea 的周旋下,軟體設計團隊不得不為 Siri 新增了一個按鈕,方便使用者回饋回答是否精準。 

無論是為了堅持隱私,還是工作流程問題,亦或是為了做出 100% 完美產品,Siri 的人工智慧團隊正在經歷著一系列的掙扎,就像被捆住了雙手與 Google、亞馬遜等大公司在人工智慧領域競爭。 

關鍵問題:是要打造一個Siri Copilot,還是推倒重來?

這個「未知」,其實可以指代許多。 蘋果人工智慧團隊對於 Siri 推出了許多改進方案,像是 Siri X、BlackBird、Pegasus 等等項目。 

雖然項目的一些成員離開,但這些項目最終都接近完成,隨時可以替換或者最佳化到現在的 Siri 當中。 

不過,就如同 John Giannandrea 所提倡的,一個人工智慧模型,其實是一個相當複雜的工程,牽一髮而動全身。 

盲目的修改和替換,可能會引起不可預知的問題。 

面對ChatGPT 蘋果到底該發展自家的Siri Copilot,還是推倒重來?蘋果自己也在矛盾中

另外,與亞馬遜的 Alexa 或Google的 Assistant 等其他語音助手相比,Siri 的回答在很大程度上依賴於人類參與。 

也就說,Siri 的資料庫有許多人為的限制和干預,經過十幾年的修改調整,讓這個資料庫變得複雜冗長。 

而且,也與目前 LLM 大語言模型的資料庫工作方式有所不同,它並不能簡單的加一個 API 介面就能夠順利的運行起 ChatGPT 和擁有類似的功能。 

蘋果現在所要決定的就是,想要一個 Smart Siri,到底是推倒重來,還是逐層最佳化。 

另外,誰都不否認,蘋果公司的盈利、現金流以及龐大的資源調動能力。並且,也有著晶片、終端等等硬體資源和知識儲備。 當蘋果下定決心全身心投入 AIGC 領域,它可以訓練複雜的大語言模型,做出自己的生成式 AI。 

但蘋果還要決定是否需要「重複造輪子」,還是把眼光、資源投入到如何將 AIGC 運用到終端,嵌入到生態當中。 畢竟那些支援 ChatGPT 等複雜服務的 LLM 目前仍在雲端運行,運用到終端生態里,還尚屬空白。 

在人事調動上,蘋果目前更注重於視覺識別的專家,相對來說,也把重心放在了適合 XR 虛擬現實領域。 

面對ChatGPT 蘋果到底該發展自家的Siri Copilot,還是推倒重來?蘋果自己也在矛盾中

對於蘋果來說,AIGC 行業的技術爆炸,還不到一年,如何運用到蘋果產品當中,也還在一個很初步的嘗試當中。 

而蘋果已經準備多年,打算取代 iPhone 成為下一個大趨勢的 XR 虛擬現實裝置,或許才是蘋果當下最該關心,以及著力去發展的產品。 

至於把 Siri 變成 Smart Siri,還是變成 Siri Copilot,不妨讓 John Giannandrea 所帶領的 AI 團隊再爬一會兒山吧。  

 

36Kr
作者

36氪(36Kr.com)累計發表超過10.8萬條包含圖文、音訊、影片在內的優質內容。氪原創內容體系涵蓋新創公司、大公司、投資機構、地方產業與二級市場等內容模組,設置有快訊、深度商業報導

使用 Facebook 留言
發表回應
謹慎發言,尊重彼此。按此展開留言規則