ADVERTISEMENT
人工智慧(AI)產業掀起一股新熱潮,一個新名詞「博士級AI」正席捲矽谷。根據美國科技媒體《The Information》報導,AI龍頭OpenAI可能計畫推出多款專業AI代理產品,其中最高階方案每月訂閱費高達2萬美元(約新台幣64萬元),主打支援「博士級研究」。其他方案則包括每月2000美元(約新台幣6.4萬元)的「高收入知識工作者」助理,以及每月1萬美元(約新台幣32萬元)的軟體開發代理。這一系列天價計畫也引發外界對「博士級AI」定義與價值的激烈討論。
「博士級AI」是什麼?
OpenAI尚未正式證實這些價格,但「博士級AI」的概念並非首次出現。簡單來說,這類AI指的是具備博士級專業能力的模型,能獨立完成高難度任務,例如進行尖端學術研究、撰寫複雜程式碼並除錯,甚至分析大規模數據並生成詳盡報告。OpenAI宣稱,這類模型解決的問題,通常需要人類花費多年學術訓練才能勝任。
這種能力從何而來?OpenAI以自家模型在基準測試中的表現作為依據。例如,其o1系列模型在科學、程式設計與數學測試中,成績堪比人類博士生。該公司還開發了一款名為「Deep Research」的工具,能生成帶引用的研究論文,在涵蓋逾百個科目、3000多題的「人類最後考試」中拿下26.6%的得分。去年12月推出的o3與o3-mini模型更進一步,採用「私有思維鏈」(private chain of thought)技術,讓AI模擬人類的推理過程,逐步解決問題後給出答案。
ADVERTISEMENT
OpenAI強調,這種技術模仿了人類研究者在面對複雜問題時的思考模式,而非立即吐出答案。他們認為,投入更多「推理時間計算」(inference-time compute),AI的回答品質會更好。因此,每月2萬美元的高價,可能是在買AI針對艱難問題的「深度思考時間」。
亮眼的基準測試成績
OpenAI的o3模型在多項測試中創下佳績。例如,在ARC-AGI視覺推理基準測試中,o3於高計算環境下得分87.5%,接近人類85%的水準;在2024年美國邀請數學考試中拿下96.7%,僅錯一題;在研究生級的GPQA Diamond測試(涵蓋生物、物理、化學)中得分87.7%。更令人驚嘆的是,在EpochAI的Frontier Math基準測試中,o3解決了25.2%的數學問題,而其他模型最高不超過2%,顯示其數學推理能力大幅領先。
這些成績讓OpenAI信心滿滿,認為「博士級AI」能應用於醫療研究數據分析、氣候模擬,甚至承擔研究工作的例行任務,為企業帶來巨大價值。據報導,OpenAI投資者軟銀今年將砸下30億美元(約新台幣960億元)採購這些代理產品,顯示市場對此寄予厚望。
ADVERTISEMENT
然而,這種高定價策略也可能與OpenAI的財務困境有關。據悉,該公司去年因運營成本與服務支出,虧損約50億美元(約新台幣1600億元)。過去數年,OpenAI以相對親民的價格(如ChatGPT Plus每月20美元,約新台幣640元)培養用戶習慣,如今推出企業級高價方案,能否讓用戶接受,仍是未知數。相較之下,競爭對手Claude Pro每月30美元(約新台幣960元),即使ChatGPT Pro訂閱費200美元(約新台幣6400元),與新方案相比仍是小巫見大巫。
「博士級」真的名副其實?
儘管基準測試成績亮眼,專家與網友對「博士級AI」標籤存疑。這些模型雖能快速處理與整合資訊,但在創造性思維、批判性懷疑及原創研究——真正博士工作的核心——上的表現仍受質疑。更令人擔憂的是,AI常出現「虛構」(confabulation),即生成看似合理卻錯誤的資訊,這在講求精準的研究領域是致命缺陷。每月花費64萬新台幣,企業是否能信任AI不犯錯,成為一大隱憂。
社群媒體上,許多人調侃不如直接聘請真博士。xAI開發者Hieu Pham在推特上寫道:「別忘了,大多數博士生,包括那些遠超當前AI的頂尖人才,月薪遠不到2萬美元。」確實,在台灣,一名博士生的獎學金或起薪約在5萬至7萬台幣之間,與OpenAI的訂閱費相比,性價比顯得更高。
ADVERTISEMENT
虛擬博士 vs. 真博士
「博士級AI」的出現,讓人不禁思考:矽谷是否過分高估了虛擬博士的價值?這些AI無需休息、不用保險,且能力有望持續進化、成本逐漸下降,確實具備長期優勢。但現階段,它們更像高效的工具,而非能取代人類博士的「全能研究者」。對台灣學術界與產業來說,這股AI浪潮或許是個啟發:如何結合AI與本地人才,創造更大價值,可能比單純追逐「博士級AI」更值得關注。
隨著OpenAI的計畫逐步明朗,這場虛擬與真實博士的價值之爭,恐怕才剛開始。
ADVERTISEMENT