Skild AI獲貝佐斯、軟銀等巨頭青睞,機器人行業的GPT-3時刻即將到來?

Skild AI獲貝佐斯、軟銀等巨頭青睞,機器人行業的GPT-3時刻即將到來?

ADVERTISEMENT

具身智慧,或者說人形機器人,現在已經成為僅次於 AI、最熱門的投資項目。無論是 OpenAI、Nvidia或者是微軟,都在砸下重金投資人形機器人團隊。 

現在,一個種子選手,正在獲得巨頭們的青睞。 

近日,一家名為 Skild AI 的公司,宣布完成 3 億美元的 A 輪融資,投資者包括傑夫‧貝佐斯、日本軟銀集團、紅杉資本和卡內基美隆大學等,使該公司估值達到 15 億美元。 

這家公司才成立不到一年,由兩名機器人領域的大學教授創立,其團隊正在構建一個「可拓展的機器人基礎模型」,作為各種類型機器人和各種現實應用場景的通用「大腦」,同時還在構建可以改裝到機器人硬體上的系統。 

該公司稱,「我們的長期目標是開發基於物理世界的通用人工智慧(AGI),挑戰 AGI 只能從數位知識中產生的流行觀念。」 

投資人為此迅速投資,認為機器人行業的「GPT-3 時刻即將到來」。 

Skild AI 到底做對了什麼?它能實現 AI+具身智慧的野心嗎? 

「機器人大模型」

Skild AI 由卡內基美隆大學教授迪派克‧帕塔克(Deepak Pathak)和阿比納夫‧古普塔(Abhinav Gupta)於 2023 年 5 月創立,正在開發基於物理世界的智慧系統,構建機器人基礎模型——可以理解為「機器人大腦」。 

他們在做的東西有什麼特別?傳統機器人技術側重於收集特定資料,來訓練機器人以完成特定任務,而迪派克和阿比納夫則利用大規模資料,透過基於 Transformer 的自我調整架構構建基礎模型,想要創建的是一個通用、魯棒且具備湧現行為的機器人模型。 

這家公司稱,自己正在突破機器人資料壁壘,其訓練模型的資料量「是競爭對手模型的千倍以上」。與那些為特定應用垂直設計的機器人不同,Skild 的模型作為各種機器人形式、場景和任務的「通用」大腦,涵蓋操作、移動和導航等功能。 

在現實世界應用中,從在惡劣物理中具備韌性的「四足機器人」,到能夠進行複雜家庭和工業任務的「人形機器人」,該公司的模型據稱都能用上。 

那麼,在理論上,這種「機器人大腦」可以為波士頓動力公司的四足機器人「Spot」以及 Agility Robotics 的人形機器人「Digit」提供「動力」,儘管公司尚未宣布具體合作夥伴。

構建「通用的」機器人基礎模型。 圖片來源:Skild AI

Skild AI 稱自己的使命是「透過開發首個真正智慧的實體系統,徹底改變未來的體力工作,目的在提升生產力和挖掘人類潛力。」願景是「建立札根於物理世界的通用人工智慧(AGI)」。 

儘管全球不少人都擔心 AI 或機器人搶工作,做機器人的公司普遍還是喜歡說自己要解決所謂的「勞動力短缺問題」,抑或者更高遠的「解放人類」。 

Skild AI 顯然也不例外。 

他們對外強調的說法是,以美國為例,目前面臨著嚴重的勞動力短缺,空缺的工作職缺比失業人數多出 170 萬個。醫療保健、建築、倉儲和製造業等行業受影響最嚴重,預計到 2030 年將有 210 萬個製造業職位空缺。 

此外,許多這些工作對人類來說可能是危險的,例如石油鑽井平臺和機器房。而 Skild 的模型使機器人能夠適應在危險環境中執行新任務,而不是由人類執行這些任務。 

Skild AI 的聯合創始人阿比納夫‧古普塔稱,「通用機器人能夠在任何環境下、安全地執行任何自動化任務,並具備任何類型的實施形式,我們可以增強機器人的能力,降低其成本,並支援嚴重人手不足的勞動力市場。」

Skild AI 稱該大腦可以適應各種硬體和任務 。圖片來源:Skild AI

機器人行業的人常說「機器人技術很難」,這幾乎成了支配該領域的無名自然法則之一。 

而且,不少人認為機器人是一個硬體問題,但 Skild AI 的創始人卻認為這是一個軟體問題。 

Skild AI 強調「規模是關鍵」,並表示他們正在發明最尖端的機器學習演算法,「重點是利用規模的力量,在任何環境中提供無與倫比的魯棒性。從建築工地到工廠再到家庭,Skild Brain 能像人類一樣適應非結構化環境。」 

這個「Skild Brain」,就是所謂的大腦,據稱是「首個可擴充的」機器人基礎模型,可以適應不同的硬體和任務,「在模型設計上具有魯棒性。」

該公司還披露了一個 Skild AI 行動操控平臺,由 Skild Brain 提供動力,在這個平臺上「可以開發用於機器人的進階 AI 演算法和應用程式」,他們想要「使機器人操作像呼叫 API 一樣簡單」。目前,該平臺尚未開放,僅允許感興趣的開發者註冊,加入早期使用等待名單。 

此外,他們推出了一個安全/檢查機器人平臺,稱提供自動化視覺檢查、資料收集或巡邏任務的解決方案。 

Skild AI 的創始團隊 。圖片來源:Skild AI

 

今年 7 月,Skild AI 宣布完成 3 億美元的 A 輪融資,融資由 Lightspeed Venture、Coatue、軟銀集團和傑夫‧貝佐斯(透過 Bezos Expeditions)領投,Felicis Ventures、紅杉資本、Menlo Ventures、General Catalyst、CRV、亞馬遜、SV Angel 和卡內基美隆大學參與了本輪融資。這次融資使公司的估值達到 15 億美元。 

Skild AI 表示,將利用這筆新資金改進其 AI 模型,同時追求商業化落地部署。長期目標是創造一種「具有與人類同等能力」且「札根於物理世界」的 AGI。 

其首席執行長兼聯合創始人迪派克‧帕塔克稱:「我們相信 Skild AI 代表了機器人技術擴充方式的一個轉捩點,具有改變整個實體經濟的潛力。」 

印度機器人大神創業

根據公司網站顯示,Skild AI 正在招聘多個工程師職務。目前團隊包括來自 Meta、特斯拉、Nvidia、亞馬遜和Google背景的成員,以及卡內基美隆大學的學生。 

兩名聯合創始人迪派克和阿比納夫,都曾是卡內基美隆大學的教授,在機器人和 AI 領域有多年研究經驗,以其在自監督機器人技術、好奇驅動的智慧體和自我調整機器人學習等領域的研究聞名。 

如果要量化其學術水準,他們兩人目前擁有 150+的 H 指數,超過 90000 次引用。

Skild AI 聯合創始人 Deepak(左)和 Abhinav(右)。圖片來源:Skild AI

迪派克來自印度的一個小鎮,在同齡人搬到大城市備戰全國考試時,他留在小鎮,仍然考上了印度理工學院(即 ITT),這是印度的最高學府,這一成就還登上了當地頭條。 

據稱,在印度時,由於缺乏條件,他還曾在家裡用紙手寫程式碼並檢查,然後在當地咖啡館有限的上網時間裡運行他編寫的程式。後來這個印度的「小鎮傳奇」就赴美國讀博,期間加入 Facebook AI 研究院(FAIR)做研究,還創辦過一家被收購的新創公司,後來選擇當教授。 

阿比納夫則是卡內基美隆大學的終身教授,和迪派克同為印度裔,曾是 FAIR 機器人研究組的創始成員和研究負責人。他和迪派克討論了十年創業的可能性。2023 年初,他們看到了自己領域技術進步的加速,意識到是時候出來大幹一場了。 

那麼,他們看到的機會具體是什麼? 在追求為機器人構建通用智慧的過程中,關鍵挑戰一直是如何在沒有大規模資料的情況下,構建一個大型模型。 

與大型語言模型不同,機器人領域沒有現成的網路資料。因此,他們探索了從現有資源中學習的不同策略:網路視訊、遠端操作、現實世界資料、模擬等。 

2015 年,他們首次實現了機器人資料的 1000 倍拓展,隨後幾年,他們嘗試了人類遠端操作和低成本機器人遠端操作平臺。2017 年,他們提出了著名的好奇心驅動學習演算法,用於構建能夠自主探索和學習的智慧體。2021 年和 2022 年,他們再次突破,採用大規模自我調整 SIM2REAL(虛擬到現實世界訓練)策略,並在機器人學習會議上獲得最佳機器人系統獎。 

這些成就,奠定了 Skild AI 的目標:一個通用模型,能夠在任何環境中完成任何任務,而無需特定訓練。有投資方認為,如果迪派克和阿比納夫能實現這一目標,他們將取得類似 GPT-3 的突破,結果可能適用於幾乎所有領域。 

機器人的「GPT-3 時刻」?

卡內基美隆大學現任機器人研究所所長馬修‧羅伯森(Matthew Roberson)為他們月臺背書稱,「Skild AI 由站在機器人技術創新尖端的的專家創立,我迫不及待地想見證他們的尖端技術如何徹底改變行業,並延續卡內基美隆大學在轉化研究方面的悠久歷史。」 

其他投資方也不吝吹捧,似乎對 Skild AI 的能力和前景充滿信心。他們大多看中的是兩名創始人對世界上一些先進機器人和 AI 實驗室的貢獻。 

在過去幾年,網路偶爾會被機器人極限跑酷、用手操控物體(包括開門和抽屜)、爬樓梯(無論是前進還是後退,室內還是室外)、以及自然流暢移動的機器人影片震撼一下,而這些進步,據稱背後都可以追溯到兩人的一些學術成果。 

有的投資人稱他們是機器人技術進步的「催化劑」,認為「他們在將基礎模型的核心原則應用於現實世界方面的創新,使行業走上了通用機器人技術的道路。」 

有的投資人提出,Skild AI 在構建機器人操作和移動的基礎模型方面,「採用了真正可擴充的方法」,「他們革命性地改變機器人技術,從預先載入程式機器人轉向動態自我調整機器人,這有可能顛覆整個實體經濟。」 

還有投資方已經投資機器人公司超過 15 年,稱 Skild 是其見過「最具遠見的」,「他們正在構建的模型將在任何環境、任何硬體上執行任何任務。」 

在 Felicis Ventures 的投資人看來,開發通用機器人智慧的競賽已經開始,沒有任何一個想法能像現在這樣快速地動員資本和人才,通用機器人基礎模型將成為這一鏈條中的關鍵環節。 

創造一個能夠在任何環境中、任何形式上進行推理、規劃和行動的「單一模型」,這個想法並不新鮮,一直是機器人行業想要奪取的聖杯,「這個想法的問題在於,幾年前它根本不可能實現。而今天,它可能成為現實。」Felicis Ventures 的投資人如此稱。 

「當我們第一次飛往匹茲堡觀看 Skild 機器人實際操作時,我們簡直不敢相信自己的眼睛。一個新創公司在如此短的時間內怎麼可能取得如此大的成就?」 

「答案在於規模。大型預訓練視覺語言動作模型(VLA)展現出與大型預訓練語言模型(LLM)相同的湧現行為,正如在代數上訓練一個 LLM 使其在西班牙語上表現得更好。」Felicis Ventures 的投資人認為「Skild 正在將這一理念推向極致。」 

Skild 正在做和想要實現的,就是透過所謂千倍以上的訓練資料量,讓機器人從沒見過的任務也能執行到位,該投資人稱已經看到了跡象。

紅杉資本的投資人也聲明稱,對 Skild AI 的團隊充滿「深刻的信念」,說他們「有潛力在現實世界中實現 OpenAI 在數位世界中所取得的成就。」

信念的一個證明是,飛速給錢。見完創始人不到一周時間內,紅杉資本就拍板決定投資 Skild AI,認為這個團隊就是他們追求的,稱「GPT-3 時刻即將到來,將為機器人世界帶來巨大變革,就像我們在數位智慧世界中看到的進步一樣。」

這些投資人認為,雖然關於 AI 對人類生活影響的討論非常熱烈,但迄今為止,大量討論仍然主要集中在軟體上,而將 AI 整合到機器人中則潛藏著巨大的機會,AGI 不是只能透過數位知識來構建。雖然一切都處於早期階段,但利用 LLM、VLM 和程式碼生成的進步,機器人製造商有機會開發更「想像這樣一個世界:一個 AI 機器人基礎模型能夠在任何環境、任何機器人硬體上完成任何任務。這將大大擴充我們可以構建的機器人類型,並且成本將比今天低幾個數量級。」 

隨著軟體領域的 AI 成為巨頭的遊戲,以及將 AI 整合到機器人的前景和吸引力。 

一波 AI 熱錢,已經轉向機器人領域。

geekpark
作者

極客公園(www.geekpark.net)成立於2010年,是中國創新者的大本營。透過對前沿科技的觀察報告,在內容媒體、會展公關、創業服務三大業務協同發展下連結資源,讓優秀的科技新創更快速的成長。

使用 Facebook 留言
發表回應
謹慎發言,尊重彼此。按此展開留言規則