來自杭州的AI新創公司DeepSeek,以其極具競爭力的成本優勢,推出「DeepSeek-V3」和「DeepSeek-R1」兩款大型模型,效能直追OpenAI,讓矽谷為之震驚。認為DeepSeek R1 是世界上最先進的 AI 模型之一,可與 OpenAI 的新 o1 和 Meta 的 Llama AI 模型相媲美。
在接受 CNBC 的最新採訪時,美國AI新創公司Scale AI 執行長 Alexandr Wang 表示,DeepSeek R1 在其公司最具挑戰性的 AI 測試中,達到或擊敗了所有表現最佳的 AI 模型。Wang,談到了 DeepSeek 的新 AI 測試,名為「人類的最後考試」,其中最難的問題是由數學、物理、生物、化學教授提出的,與最新研究相關。
在測試了所有最新的 AI 模型後,Wang 的團隊發現 DeepSeek 的新模型實際上是表現最好的,或者大致與美國最好的模型相當,而美國最好的模型是 o1。
當被問及中美之間的人工智慧競爭時,Wang 教授補充道:長期以來,美國一直處於領先地位。但他指出,DeepSeek 的新模型確實試圖改變這一現狀,他認為中國實驗室在聖誕節發布驚天動地的模型具有象徵意義,因為大家都在慶祝聖誕節。
DeepSeek 的一篇研究論文顯示,它使用了大約 2000 個輝達 的 H800 晶片,這些晶片的設計目的是遵守美國 2022 年發布的出口管制措施,但專家指出,這些晶片幾乎不會減緩中國 AI 發展進步。
拜登政府實施了限制措施,以阻止強大的 AI GPU 進入中國。但將先進的 AI 晶片引入中國似乎並不那麼困難,Wang 告訴 CNBC:「現實是肯定的,也是否定的。你知道中國實驗室擁有的 H100 比人們想像的要多。」
Wang 先生表示,據他了解,DeepSeek 擁有大約五萬個 H100,並指「但是很明顯他們不能說出來,因為這違反了美國所實施的出口管制,我相信他們擁有比外界想像的更多,他們未來會被晶片管制,和出口管制所限制」。
未來,對於中國獲得先進的人工智慧晶片,Wang表示:「但從長遠來看,它們也將受到我們現有的晶片管制和出口管制的限制。」
圖靈獎得主、Meta AI 首席科學家楊立昆認為,DeepSeek 的成功並非代表中國在 AI 方面超越美國,而是開源模型正在超越專有模型。這顯示美國對於 AI 技術發展路線的思考正在發生轉變。
研究中國創新的雪梨科技大學副教授 Marina Zhang 表示:與許多嚴重依賴先進硬體的中國人工智慧公司不同,DeepSeek 專注於最大限度地最佳化軟體驅動的資源。DeepSeek 採用開放原始碼方法,匯集集體專業知識並促進協作創新。這種方法不僅可以緩解資源限制,還可以加速尖端技術的開發,使 DeepSeek 從更孤立的競爭對手中脫穎而出。
請注意!留言要自負法律責任,相關案例層出不窮,請慎重發文!