ADVERTISEMENT
萬眾矚目,Google的反擊來了。
現在,Google搜尋終於要加入AI對話功能了,排隊通道已經開放。
當然這還只是第一步。
大場面的還在後面:
全新大語言模型PaLM 2正式亮相,Google聲稱它在部分任務超越GPT-4。
Bard能力大更新,不用再排隊等候,並支援新語言。
Google版AI辦公助手也一併推出,將在Gmail中搶先亮相。
Google雲端也上線多個基礎大模型,為行業提供更進一步的生成式AI服務……
在最新一屆I/O開發者大會上,Google的大放送真的很震撼。
有網友直呼:
AI大戰全面開啟。
有人甚至表示:
現在我後悔為ChatGPT付費了。
一場發表會結束,Google股價上漲超4%。
PaLM 2部分任務超越GPT-4
毫無疑問,PaLM 2是今年I/O大會的重中之重,由皮查伊親自做介紹。
目前的Bard以及Google超過25個AI產品和功能,現在都由PaLM 2作為底層技術支援。
作為Google目前最先進的大模型,PaLM 2基於Pathways架構,是PaLM的升級版,透過JAX在TPU v4上構建。
據介紹,PaLM 2接受了100多種語言的訓練,這使得它在語言理解、生成和翻譯上的能力更強,並且會更加擅長常識推理、數學邏輯分析。
Google表示,PaLM 2的資料集中有巨量論文和網頁,其中包含非常多數學運算式。在這些資料的訓練後,PaLM 2能輕鬆解決數學問題,甚至是製作圖表。
程式設計方面,PaLM 2現在支援20種程式設計語言,如Python、JavaScript等常用語言,以及Prolog、Fortran和Verilog等。
這一次Google一次推出了四種不同size的PaLM 2。
他們用不同的動物來體現規模大小。最小的是「壁虎」,最大的是「獨角獸」。
其中「壁虎」版本是非常羽量級的,能在行動設備上快速運行,包括離線狀態;每秒可處理20個token。
DeepMind副總裁在I/O大會前的新聞發表會上表示:
我們發現模型並不總是越大越好,這也是為什麼我們決定提供一系列不同規模的模型。
這意味著微調PaLM 2會更加方便,由此它也能支援更多產品和應用。
在I/O大會上,Google就宣布了現在已經有超過25個產品和應用正在使用PaLM 2的能力。
具體的表現形式,就是Duet AI。
Duet AI可以將它理解為微軟365 Copilot的對手產品,是一個能夠內嵌在各種辦公軟體中的AI助手。
Google在發表會現場已經展示了Duet AI在Gmail、Google Docs、Google Sheets中的能力。
包括根據提示補充郵件內容、產生PPT、根據提示產生圖片素材、一鍵產生表格等。
同樣,這個AI助手也能提供程式設計幫助。基於Google雲端,它能即時推薦、糾正程式碼區塊,並且以對話方式解答程式設計問題,目前支援Go、JavaScript、Python和SQL。
另外基於PaLM 2,Google還推出了一些專業領域大模型。
Google的健康團隊打造了Med-PaLM 2。它能回答各種醫學問題,據稱是首個在美國醫療執照考試中達到專家水準的大語言模型。
目前Google正在嘗試讓它具備多模態能力,比如自己檢查X光片後給出診斷。在今年夏天晚些時候,這個模型將對一小部分Google雲端使用者開放。
另一個專業大模型是Sec-PaLM 2。
這是一個面向網路安全維護的大模型,它能分析和解釋潛在的惡意腳本,並檢測腳本的危險性。
那麼,在展示了PaLM 2一眾卓越能力後,就該聊聊怎麼開放使用了。
Google表示,現在可以透過PaLM API介面、Firebase和Colab使用PaLM 2。
Bard全面開放,支援圖片、整合自家地圖等應用程式
目標是ChatGPT的Bard終於取消排隊試用,在全球180+國家和地區進行全面開放了。
新增黑暗模式,備受程式設計師好評。
除了擴大存取範圍,Bard也在英文之外,新增直接用日語和韓語對話的功能。中文看起來還得再等下一波——Google表示,很快就會新增到40種語言版本。
由於從今天起,Bard將全面接入PaLM 2,所以它在程式設計和推理上面的能力也有了很大的提升,產生程式碼、調試和解釋都更加專業(獲得程式設計師認可的那種)。
當你讓它用python寫一段西洋棋中的「四回合將殺」(scholar’s mate)招式,裡面參考了別的程式碼,它會給出相關連結,方便你查看。
你可以就它給出程式碼中某個不懂的函數進行進一步提問,問它能否再改善一下,或者是要求它將所有內容都合併的一個代碼塊中。
不過,最驚喜的當屬應廣大開發者要求,加入了一鍵導入功能。
現在,你可以將Bard生成的程式碼直接匯出到Colab。
除了程式碼,你用Bard產生的任何內容,比如電子郵件草稿、表格什麼的也都可以直接拖到Gmail、Docs和Sheets中。
對了,Bard現在的回答中也支援圖片了。拿來問旅遊攻略最方便不過:
除了它能用圖片回答你,你也能直接丟給它圖片,比如上傳一張兩隻狗狗的照片,讓它來幫你編點好玩的故事:
這個功能由Google Lens(一款能讓機器學會「看圖說話」的AI應用)提供支援。
除了Google Lens,Docs、Drive、Gmail、地圖等多個Google自家的應用能力也整合到了Bard之中。
比如在Bard的回答中直接用Google地圖查看幾所大學的地理位置:
有種現在要用Google的各種產品,只用Bard一個入口就夠了的感覺。
除了自家應用程式,Bard這次還把Adobe Firefly搬了上來,各種有版權的創意圖像用對話就可以「信手拈來」:
搜尋重構,加入AI對話
千呼萬呼,Google搜尋終於開啟了AI對話的能力。
「一家帶有一個不到3歲孩子和一隻狗的家庭來說,去布萊斯峽谷還是拱門國家公園遊玩更好?」
對於這個問題,擱以前,你可能需要自己把它拆成各種小問題去搜尋引擎整理大量資訊,最終才能找到答案。
現在Google讓你儘量一步到位。
如圖所示,Google搜尋沒有簡單地搬運搜出來的答案,而是將孩子和狗這兩個因素都考慮進去給出整理後的回答,比如它說:
布萊斯峽谷有兩條狗能進入的環路,對嬰兒車也十分友好;拱門國家公園則大部分路段都不允許寵物進入;兩個地方都要求寵物拴上皮帶等。
每句話都有具體的依據連結供查看:
除此之外,它還會顯示了來自不同網站網友發表的攻略連結。
最重要的是,你可以對它的回答進行進一步對話式的提問,點擊「ask for a follow up」按鈕即可。
用新的Google搜尋進行購物也非常有趣,它號稱可以幫你迅速做出理性的購買決定。
比如當你想要一輛「適合5英里山地通勤的自行車」,它會先告訴你挑選之前需要考慮的重要因素,比如:
一看設計:電動自行車、公路自行車和混合動力自行車等適合通勤;
二看電機和電池,三看減震用的懸架,有山路的通勤需要應對裂紋和顛簸帶來的衝擊等。
然後再給你推薦合適的車,推薦時還會給出具體產品說明、最新評價、價格和圖片等全面資訊。
你也可以進行進一步提問,比如只要紅色電動自行車,它會進一步最佳化回答。
這個功能由Google的購物比價產品Shopping Graph提供支援,它可以搜集並不斷更新來自全世界的產品清單。
值得一提的是,Google直言更新後的AI搜尋介面照樣會植入廣告,但放心:它只會在專用廣告位中出現,不會混進你的搜尋結果中。
最後,這個新功能目前還只能在GoogleSearch Labs中申請試用,且僅限美國地區的使用者體驗。
三大基礎模型上線Google雲端
今年I/O大會,Google雲的內容也同樣搶眼。
在更新了一大波AI能力後,Google為自家雲端機器學習平臺Vertex AI,上新了三款大模型:
- Codey:text-to-code,幫助程式設計師寫程式碼
- Imagen:text-to-image,產生高品質圖像
- Chirp:speech-to-text,方便溝通
這三種模型的能力其實在今天的發表會上都有展示過,比如產生程式碼、Google照片智慧編輯等。
除此之外,在Vertex AI上現在還能使用文本和圖像的嵌入式API。它支援將文本和圖像資料轉換為多維數值向量、映射語義關係,進而允許開發者創建出更加有意思的應用。
另一個重大更新則在RLHF上,Google表示他們是首個將此功能作為託管服務放到端到端機器學習平臺行的。好處是能讓企業結合RLHF快速訓練獎勵模型,用於微調基礎模型,這對於大模型在行業應用中的準確性提升非常關鍵。
除了模型方面,Google雲在訓練上還推出了下一代A3 GPU超級電腦。透過將A3虛擬機器和Nvidia H100結合,Google雲能夠提供更大的運算輸送量和頻寬,能夠讓企業更快開發機器學習模型。
除了這些,Google這次還帶來售價1799美元(合台灣5萬6千元)的首款折疊螢幕手機等新硬體產品,以及接入AI功能的Android 14系統(比如提供資訊回復建議什麼的),這裡就不一一展示了。
總的來看,作為第15屆I/O大會,Google這次著實給大家帶來了非常多的有料的東西。
值得一提的是,這次上臺介紹的發言嘉賓,已不見Jeff Dean的身影,他前幾日剛剛職級變動。
作為從前Google AI最代表性發言的高管,在AI 2.0浪潮裡,將何在?
Google是否還能在大模型和AI搜尋領域中奮起追上,也值得期待。
請注意!留言要自負法律責任,相關案例層出不窮,請慎重發文!