ADVERTISEMENT
在Google巨大的商業化版圖面前,單純提前一天發佈GPT-4o,似乎並沒有給OpenAI帶來足夠的優勢。在2024 Google I/O大會上,Google展示了一系列AI技術突破,包括AI生成影片、AI驅動的Workspace自動化工具,以及產品效果直逼GPT-4o的語音助手。眾多AI產品的發佈,形成了某種意義上的“狼群效應”,正幫助Google扭轉被動追趕的局面。
另外,Gemini的多模態能力、Android 15的AI增強,不僅提升了使用者體驗,也顯著增強了Google生態系統的粘性。相比之下,OpenAI可能技術上領先一步,但在應用廣度上顯得相對單一。
如今,Google 的反擊越來越犀利,而對於 GPT-5 的發佈時間仍持謹慎態度的 Sam Altman 而言,壓力變得越來越大。
ADVERTISEMENT
巨頭反擊教材第一章:放大優勢
巨型企業的戰略佈局,往往建立在持續加強優勢業務的前提下。而Google 起家於搜尋,長於Workspace等一系列辦公套件服務,而這也成了2024年Google I/O大會發佈的重點。
完善的 AI 搜尋能力,是業內翹首以盼的。Google本次發佈的 AI Overview,在多模態的問題上做足了文章。
ADVERTISEMENT
比如「Ask with video」,利用Gemini的多模態能力與Google Lens相結合,可以實現視訊搜尋,只要錄製一段影片,就能知道使用者使用唱片機,甚至維修照相機;Google Photos中還推出了新的AI功能「Ask Photos」,可以通過簡單的提問在大量照片中找出「孩子多年來學習游泳的歷程」。
ADVERTISEMENT
OpenAI還展示了一款名為Project Astra的多模式AI助手,可以觀看並理解通過裝置鏡頭看到的內容,記住使用者的東西在哪里,幫使用者在現實世界搜尋物品,或是完成其他任務。
Google 版 AI 搜尋的輸出結果不再是網址的羅列,而是一個全新的整合頁面——它更像一份針對使用者提問而形成的報告,不僅包括對問題本身的回答,也包括對使用者可能忽略問題的猜測和補充,在產品形式上,也算做到了圖文並茂。
Google 此次對於 AI 搜尋的革新可見一斑。在有限的搜尋引擎市場裡,這奠定了全新的標準。而對於模式已經固化多年的搜尋廣告而言,也更有想像空間。
ADVERTISEMENT
Google 不是在發佈某一項大型語言模型能力,而是在試圖重新佔領使用者心智。當下,Google 的搜尋裡面是「Ask,Not Search」,多模態的互動方式,只是在使用者層面進一步完善圍繞 “Ask” 建立的產品概念。
搜尋的改造僅僅是個開始,Google希望搜尋能成為激發使用者AI需求的超級入口,即使使用者不知道具體該問什麼,Google也可以給出推薦,幫使用者腦暴。這時,搜尋介面會進一步變化,變成資訊流的形式,每個卡片都可以進一步操作。
在搜尋之外,Google的另一個優勢領域是Workspace。Google為Workspace發佈了一款產品——AI Teammate。
首先,Gemini 1.5 Pro即將被植入Workspace的文件、表格、幻燈片、雲端硬碟和 Gmail 的側邊欄中,涵蓋企業日常營運的各個方面。Gemini 可以幫使用者尋找具體的業務資訊而不是通用資訊;直接從電子郵件中檢索相關的PDF檔案;整理和管理電子郵件中的收據,並進行歸檔,或者從收據中提取資訊並新增到表格中。
Gmail App中加入Gemini後,還可以提供了更加詳細和上下文相關的回覆建議,還能夠為使用者提供電子郵件的摘要。
同時,Google還將 Gemini與Google生態的日曆、任務、Keep內建,使其 AI 產品成為一個全面的數字助理。Google還在Gemini 執行任務前設定了檢查機制,確保資訊的精準性,而Google助力相比其他智慧助手最大的優勢就在於Gemini與Google原生產品的無縫內建。
在企業中,數位員工最早的產品是利用RPA(機器人流程自動化)來自動化執行重複性、高量化、基於規則的任務。過去一年中大型語言模型爆發,使很多辦公軟體、辦公協作產品公司看到了機會,紛紛在會議郵件、協同,以及文件管理等領域推出了大型語言模型加持的數位員工產品。
Google入局此類產品,無疑加劇了行業內的競爭,也給關注此領域的企業樹立了一個“巨頭”標竿。在Google全套工具的配合下,AI teammate的AI不再是散點工具。它的功能不只是簡單的安排日程、訂會議、做會議紀要。
在Google全家桶的配合下,AI teammate可以真正理解業務流,理解業務上下文,並給出結論,甚至幫助評估風險業務,回答項目能否按期完成,這甚至已經接近一個「董事長特助」的工作了
Gemini支援的Workspace將在2024年6月,以“通用助手”的形式向付費訂閱者推出。
AI搜尋和AI Workspace共同組成了Google版AI Agents的初貌:更強的多模態能力,全面深入多個場景的資訊處理,真實理解企業的工作流。相比之下,OpenAI的GPT-4o雖在生成式AI技術上有優勢,但在辦公應用場景中尚未形成全面、高效的解決方案。
巨頭反擊教材第二章:多打組合拳
除了核心優勢業務,Google也在2024 Google I/O大會上對整個生態系統進行了全面升級。
首先是圍繞YouTube的視訊領域。Google推出了對標Sora的Veo,Veo同樣可以輸出時長1分鐘左右的穩定1080p視訊。Google稱已經向一些創作者提供 Veo,用於YouTube影片製作,同時也向好萊塢推銷其用於電影製作,且Veo的部分功能將很快落到YouTube Shorts 中。
Google還推出了對標GPT-4o的「可打斷的」語音助手Gemini Live,可以在Android上實現雙向流暢的AI對話體驗;還有角色聊天機器人Gems ,與OpenAI的GPT Store,以及Character.AI類似,Gems可製作定製的ChatGPT聊天機器人,完成某些任務並保留特定的特徵,例如與愛因斯坦或馬斯克對話,甚至可以為自己製作一個「假的」心理醫生。
此外,Google 和OpenAI 一樣,都關注教育情境。
Google推出了Android 的 Circle to Search,可以應用到家庭教育場景中。通過多模態模型提供個性化的互動式教育體驗。這款產品不僅能理解和回應學生的問題,還能根據學習進度調整教學內容,提升了教育過程的互動性和效果。
疫情放大了線上教育的價值,家長也開始不斷提高對家庭教育的重視。調研機構MarketsandMarkets的分析指出,全球數位教育市場規模預計從2023年的194億美元增長到2028年的667億美元,年複合增長率達28.0%。
Gems、Circle to Search與Gemini Live等產品,無疑可以大幅提高線上教育的互動體驗,並基於AI為不同孩子提供個性化的教育方案,彌補了傳統教育模式難以滿足所有學生的需求的問題。
除了商業生態和情境,在AI基礎設施方面,Google也進行了升級,這一點主要針對大型語言模型ToB 業務的成本問題。
本次Google I/O大會上,Google將自研AI晶片升級到第六代TPU(張量處理單元)Trillium,與第五代相比,每個TPU的計算性能提高了4.7倍。Google還宣佈將成為首批提供 NVIDIA 下一代 Blackwell 處理器存取權的雲端提供商之一。
Google CEO Sundar Pichai表示:「我們將繼續投資基礎設施,以推動人工智慧的進步。」
相比於OpenAI和微軟的合作模式,Google通過自身業務生態系統的緊密協作,提升了Google Cloud以及AI相關服務的相容性和互操作性,也為開發者提供了更強大的工具和支援,整體的技術和商業化競爭優勢更加明顯。
在本次Google I/O大會上,Google總共124次提及AI。從商業生態到應用情境,再到基礎設施,Google幾乎對所有產品、能力進行了一次圍繞AI的升級。
相對於 OpenAI,Google 業務的戰線更長,這既是劣勢,也是優勢。一套組合拳下來,OpenAI 前一日的全部發佈,成為了Google 發佈的章節內容。這使得 Google 從單純的產品性能對比層面一躍而出,居高臨下的俯視 2024 年初的生成式 AI 市場競爭。
巨頭反擊教材第三章:來點新公司玩不起的
對於Google來說,所有的軟體能力,最終都會在硬體上有所體現——為什麼不呢?Google 既有產品線,也有相關市場經驗。相對於軟體服務,硬體業務的重資產屬性更明顯,新銳公司很難玩得起,但Google 如魚得水。
Google在本次大會中不僅明確表示了Pixel手機將具備原生Gemini能力,使裝置的多工處理能力大幅提升,還宣佈了很多Android 15中將推出的AI功能。
事實上,Gemini早已作為獨立App在Android 端上線。此次,更新中Gemini對話過程中,用可以直接將生成的圖像拖曳到其他應用中使用。在 Android 15 中,Gemini則支援了 YouTube 容識別功能。Gemini 可以在影片播放介面直接提取相關資訊,回答使用者關於影片的各種問題,甚至生成影片內容摘要。
此外,使用者可以同時運行多個應用程式而不影響性能,這在以往手機中是難以實現的。此外,Gemini AI根據使用者習慣提供個性化推薦,使手機使用更加貼心便捷。這種智慧化服務提高了使用者滿意度,增強了Google在智慧型手機市場的競爭力。
即時語音助手功能,在Pixel以及Android系統中的落地,也必將使生態更加閉環。
在Gemini發佈時提到的輕量化Nano版本已確認將用於Chrome的改進,在輕量化模型方面,Google又推出了全新的Gemini Flash。這兩款Gemini模型以及開放原始碼的Gemma模型,都將在未來的端側AI裝置方面,為Google積蓄模型力量。
相比於過去單純討論晶片性能和安全性,Google的AI手機更加性感,也更符合實際。雖然Pixel手機的硬體水平在手機行業中一直處於落後地位,其唯一的競爭優勢就是原生Android系統。如今作為Android+AI的原生裝置,Pixel或將迎來新的春天。
Android的Gemini更新將在「未來幾個月內推廣到數億台裝置」,並且更多的上下文功能正在開發中。
Android的生態能力優勢,第一次變得如此突出,Gemini 在其中加碼極大。對於蘋果而言,在WWDC到來前,一切都是未知。
有趣的是,AI不僅在Google的主力硬體產品中找到了豐富的應用情境,Google還展示了Google Glass的最新應用,似乎想告訴外界:有了AI的加持,即使是過去被認為失敗的計畫,如今也能為新的創新提供基礎和靈感。
由此向下繼續推演,在Gemini和硬體能力的加持下,即使Google要殺入最火熱的AI PC市場的也會 “順滑”無比。
結語
如何評價Google本次發佈?不妨先看一下Google對哪些公司造成了威脅。
首先,AI搜尋。除了已知的AI搜尋公司Perplexity AI,以及傳說中的OpenAI搜尋,Google最直接威脅的當然是傳統的搜尋引擎。Google不只是簡單的在搜尋結果中增加一個AI總結,或是以自然語言對話方式進行搜尋,Google的多模態AI搜尋,幾乎可以說是改變了搜尋的範式,提升搜尋智慧化的同時,極大地提高了使用者的使用體驗。
基於Google這樣的升級不管是有GPT-4加持的Bing,還是利用文心一言探索AI搜尋的百度,都必須在AI+搜尋的產品力方面加快創新步伐,才有可能在這一領域保持競爭力。
在辦公軟體、協作辦公方面。Workspace的升級,使Google有能力提供「真正的」數位員工。Google不只是要對標老牌競爭對手微軟,更是對所有研發數位員工、AI辦公軟體以及AI協同辦公的供應商發出了挑戰。任何這類公司正在研發文件處理,以及辦公、協作等方面的工作,可能都要重新評估自身的產品力。
在手機行業中,受到AI衝擊最大的廠商必然是蘋果,作為AI大型語言模型時代唯一落後的巨頭,如果不在iOS生態中引入更多創新,蘋果恐怕很難應對來自Android陣營的AI攻勢。而其他手機廠商,不管如何高唱AI手機概念,在Android+Gemini的裹挾下,基於系統的AI升級空間將會越來越小,要保持競爭力,就只能在硬體、生產成本,以及供應鏈等方面更省了。
而對於整個AI行業來說,首當其衝的是OpenAI。過去一年中,OpenAI憑藉巨量資料、大算力、強演算法、強工程的優勢,在AI行業內保持了一個身位的領先優勢。而隨著技術的普及和其他科技行業的發展OpenAI所謂的技術優勢,支撐正在變低。OpenAI的領先技術正在從過去的被模仿,變成同期發佈。
AI公司的技術競爭正在悄然向商業競爭和產品競爭過度。Google通過整合其廣泛的產品生態系統,將AI技術落地到更多實際場景,如手機、辦公軟體、智慧家居和線上教育等。一步步建構了龐大的商業生態和穩固的市場領先地位。
未來的競爭,或將更多地體現應用在場景中的多樣性和市場主導地位的爭奪上。在GPT-5或是其它更強大的AI大型語言模型到來之前,OpenAI等AI公司在應用場景上的劣勢將會被Google持續放大。
如今,Google正在以教科書般的方式展示如何在激烈的市場競爭中,通過技術和商業戰略的雙管齊下實現反擊。這不僅僅是技術上的博弈,更是商業模式和生態系統建構上的較量。
- 延伸閱讀:Gemini 1.5 Pro 更新,將成為全能助理、理解合約、模擬面試都成為可能
- 延伸閱讀:Google 為 Gemini 新增 Gems 功能,可創建個人化 AI 聊天機器人
- 延伸閱讀:Google Workspace 加入 Gemini 側邊欄,Google 文件、Drive、Gmail 都常駐 AI 助理
ADVERTISEMENT