ADVERTISEMENT
來自杭州的AI新創公司DeepSeek,以其極具競爭力的成本優勢,推出「DeepSeek-V3」和「DeepSeek-R1」兩款大型模型,效能直追OpenAI,讓矽谷為之震驚。認為DeepSeek R1 是世界上最先進的 AI 模型之一,可與 OpenAI 的新 o1 和 Meta 的 Llama AI 模型相媲美。
在接受 CNBC 的最新採訪時,美國AI新創公司Scale AI 執行長 Alexandr Wang 表示,DeepSeek R1 在其公司最具挑戰性的 AI 測試中,達到或擊敗了所有表現最佳的 AI 模型。Wang,談到了 DeepSeek 的新 AI 測試,名為「人類的最後考試」,其中最難的問題是由數學、物理、生物、化學教授提出的,與最新研究相關。
在測試了所有最新的 AI 模型後,Wang 的團隊發現 DeepSeek 的新模型實際上是表現最好的,或者大致與美國最好的模型相當,而美國最好的模型是 o1。
ADVERTISEMENT
當被問及中美之間的人工智慧競爭時,Wang 教授補充道:長期以來,美國一直處於領先地位。但他指出,DeepSeek 的新模型確實試圖改變這一現狀,他認為中國實驗室在聖誕節發布驚天動地的模型具有象徵意義,因為大家都在慶祝聖誕節。
DeepSeek 的一篇研究論文顯示,它使用了大約 2000 個輝達 的 H800 晶片,這些晶片的設計目的是遵守美國 2022 年發布的出口管制措施,但專家指出,這些晶片幾乎不會減緩中國 AI 發展進步。
拜登政府實施了限制措施,以阻止強大的 AI GPU 進入中國。但將先進的 AI 晶片引入中國似乎並不那麼困難,Wang 告訴 CNBC:「現實是肯定的,也是否定的。你知道中國實驗室擁有的 H100 比人們想像的要多。」
ADVERTISEMENT
Wang 先生表示,據他了解,DeepSeek 擁有大約五萬個 H100,並指「但是很明顯他們不能說出來,因為這違反了美國所實施的出口管制,我相信他們擁有比外界想像的更多,他們未來會被晶片管制,和出口管制所限制」。
未來,對於中國獲得先進的人工智慧晶片,Wang表示:「但從長遠來看,它們也將受到我們現有的晶片管制和出口管制的限制。」
圖靈獎得主、Meta AI 首席科學家楊立昆認為,DeepSeek 的成功並非代表中國在 AI 方面超越美國,而是開源模型正在超越專有模型。這顯示美國對於 AI 技術發展路線的思考正在發生轉變。
ADVERTISEMENT
研究中國創新的雪梨科技大學副教授 Marina Zhang 表示:與許多嚴重依賴先進硬體的中國人工智慧公司不同,DeepSeek 專注於最大限度地最佳化軟體驅動的資源。DeepSeek 採用開放原始碼方法,匯集集體專業知識並促進協作創新。這種方法不僅可以緩解資源限制,還可以加速尖端技術的開發,使 DeepSeek 從更孤立的競爭對手中脫穎而出。
ADVERTISEMENT