2025.02.28 11:34

GPT-4.5強勢登場!效能狂飆10倍,OpenAI執行長驚呼:像跟真人對話!

ADVERTISEMENT

 

最新消息!人工智慧(AI)巨頭OpenAI週四(28日)震撼發布GPT-4.5,這款被譽為歷來最強大的大型語言模型(LLM)研究預覽版,專為聊天應用量身打造。不過,OpenAI也坦言,GPT-4.5堪稱是史上最燒錢的模型。

值得注意的是,GPT-4.5仍屬於傳統大型語言模型,而非近期備受矚目的「推理模型」。包括OpenAI、DeepSeek、Anthropic等科技大廠,都已競相推出推理模型。這類模型主打「思維鏈」或類意識流的文本生成技術,透過反思自身假設與結論,力求在回應使用者或產出內容前,抓Bug、除錯。

ADVERTISEMENT

儘管如此,OpenAI共同創辦人兼執行長奧特曼(SamAltman)在社群平台X(前身為推特)上盛讚,GPT-4.5是「首款讓我感覺像在跟真人對話的模型。我多次驚嘆AI竟能給出真正實用的建議。」

奧特曼也提醒,由於GPU供貨吃緊,OpenAI不得不限縮GPT-4.5的存取權限。他坦言:「壞消息是:這是一款超級龐大且極度昂貴的模型。我們原планировали同步向Plus和Pro用戶全面開放,但用戶量爆量成長,導致GPU資源捉襟見肘。我們計畫下週加碼數萬顆GPU,後續將逐步向Plus訂閱用戶解鎖。(很快就會有數十萬顆GPU陸續到位,我相信大家會物盡其用,榨乾我們部署的每一顆GPU。)這並非我們理想的營運模式,但需求爆衝實在難以神準預測。」

ADVERTISEMENT

自美東時間週四起,GPT-4.5將率先向OpenAI最頂級的訂閱服務ChatGPTPro(月費200美元)用戶開放,並同步釋出給所有付費API層級的開發者搶先體驗。OpenAI也預計在下週將服務範圍擴大至價格相對親民的Plus和Team方案(月費20/30美元)。

功能方面,GPT-4.5支援搜尋功能和畫布模式,使用者也能上傳檔案和圖片。但多模態功能(例如語音模式、影片和螢幕共享)暫時缺席,短期內恐難上線。

無監督式學習再進化AI技術大躍進

GPT-4.5代表人工智慧訓練領域的顯著突破,尤其在無監督式學習方面突飛猛進,大幅提升模型辨識模式、建立關聯及產出創新洞見的能力。

ADVERTISEMENT

OpenAI研究人員透露,GPT-4.5透過基於較小型AI模型生成的數據進行訓練,有助於強化其「世界模型」。他們也表示,該模型同步運用多個數據中心進行預訓練,意味著它採用了類似競爭對手NousResearch的分散式方法。

這種訓練模式顯然助攻GPT-4.5學會產出更自然、更直覺的互動,同時更精準掌握使用者意圖,並展現更高竿的情商。該模型在OpenAI先前關於人工智慧擴展的研究基礎上再創高峰,進一步驗證了「增加數據和運算能力有助於提升人工智慧效能」的硬道理。

相較於前代模型及其他同級產品,GPT-4.5預估能大幅降低幻覺現象(幻覺率僅37.1%,相較之下GPT-4為61.8%),大幅提升在處理廣泛議題時的可靠度。

ADVERTISEMENT

GPT-4.5的殺手級特色

根據OpenAI說法,GPT-4.5旨在打造親切自然、直覺流暢的對話體驗。它對語義細微差異和上下文有更強大的掌握能力,能實現更擬人化的互動,並更有效地與使用者協作。

GPT-4.5透過擴充的知識庫和敏銳的線索解讀能力,在多個領域展現亮眼效能,包括:

——寫作輔助:優化內容、提升清晰度、激發創意

——程式設計支援:偵錯、提出程式碼改進建議、自動化工作流程

——問題解決:提供詳盡解釋,並協助制定實際決策

此外,GPT-4.5也導入全新的對齊技術,強化其對人類偏好和意圖的理解能力,進一步優化使用者體驗。

如何搶先體驗GPT-4.5?

自美東時間週四起,ChatGPTPro用戶即可在網頁、手機及桌機端的模型選擇選單中,自由選用GPT-4.5。OpenAI計畫在下週將該模型擴展至Plus和Team用戶。

針對開發者,GPT-4.5將透過OpenAI的API介面釋出,包括ChatCompletionsAPI、AssistantsAPI和BatchAPI。它完整支援函數呼叫、結構化輸出、串流傳輸、系統訊息和圖像輸入等關鍵功能,使其成為多種人工智慧驅動應用的萬用工具。不過,GPT-4.5目前尚不支援語音模式、影片或螢幕共享等多模態功能。

定價策略與企業決策影響

企業和團隊領導者可充分利用GPT-4.5帶來的多元功能。憑藉更低的幻覺率、更強的可靠性和自然流暢的對話能力,GPT-4.5有望助攻各行各業升級轉型:

——優化客戶互動:企業可將GPT-4.5整合至客服系統,實現更即時、更自然的互動,同時降低錯誤率

——強化內容生成:行銷和公關團隊可高效產出高品質、符合品牌調性的內容

——精簡營運流程:AI驅動的自動化功能,可助攻偵錯、優化工作流程並輔助策略決策

——高擴展性與客製化:API介面讓企業能量身打造,客製化符合特定需求的AI解決方案

然而,對於有意透過GPT-4.5開發應用的第三方開發者而言,GPT-4.5的API定價貴到嚇人,每百萬tokens輸入/輸出要價75美元/180美元,相較之下,GPT-4o的定價僅2.50美元/10美元。

隨著其他競品模型接連問世,例如Anthropic的Claude3.7、Google的Gemini2Pro,以及OpenAI自家的推理「o」系列(o1、o3-miniHigh、o3),GPT-4.5的效能提升是否足以彌補其高昂成本,尤其是在透過API串接使用時,將成為後續值得關注的焦點。

AI研究人員與資深用戶早期反應褒貶不一

GPT-4.5的發布在社群平台上掀起AI研究人員和科技愛好者的熱烈討論,尤其在該模型的「系統卡」(systemcard,即概述其訓練和評估的技術文件)提前外洩後,文件中意外曝光一系列官方公告前的基準測試結果。

OpenAI在外洩事件後發布的最終版系統卡,與外洩版本存在顯著差異,刪除了外洩版中「GPT-4.5並非前沿模型,但它是OpenAI規模最大的LLM,運算效率較GPT-4提升10倍以上」的說法。OpenAI發言人表示,這種說法並不精確。

人工智慧模型供應商NousResearch的共同創辦人Teknium(化名)對OpenAI的新模型表示失望,直言在多語言理解(MMLU)和實際編碼基準測試中,GPT-4.5相較其他領先的大型語言模型(LLM),進步幅度微乎其微。Teknium質疑:「距離GPT-4發布已經超過2年,OpenAI投入的資金規模擴大上千倍……究竟發生了什麼?」

此外,有人認為,GPT-4.5在軟體工程基準測試中表現遜於o3-mini,這讓人質疑這次發布是否代表了真正的技術進步。

然而,也有部分用戶為GPT-4.5的潛力辯護,認為其價值不應僅僅仰賴基準測試的結果。

軟體開發人員Haider(@slow_developer)強調,GPT-4.5相較GPT-4在運算效率上提升了10倍,且其在綜合任務處理能力上優於OpenAI專注STEM領域的o系列模型。

AI新聞發布者AndrewCurran(@AndrewCurran_)則從定性角度出發,預測GPT-4.5將在寫作和創造性思維領域樹立新標竿,並盛讚其為OpenAI的「傑作」。

這些討論凸顯了人工智慧領域一個更廣泛的爭論:技術進步是否應單純透過基準測試來衡量,還是應更側重於推理能力、創造力和擬人化互動等定性方面的改進?

仍處於研究預覽階段

OpenAI將GPT-4.5定位為研究預覽版,以深入了解其優勢與局限性。該公司表示,將持續探索用戶與模型的互動方式,並挖掘非常規應用場景。

OpenAI聲稱:「我們發布GPT-4.5作為研究預覽版,以更深入了解其優勢與局限性。擴展無監督式學習將持續推動人工智慧的進步,提升準確性、流暢性和可靠性。」

隨著OpenAI不斷精進其模型,GPT-4.5為未來的人工智慧進步奠定了基礎,尤其是在推理和工具使用代理方面。儘管GPT-4.5已展現令人印象深刻的能力,OpenAI仍積極評估其在生態系統中的長期角色。

憑藉更廣泛的知識庫、更高的情商和更自然的對話能力,GPT-4.5將為各領域的用戶帶來顯著改進。OpenAI期待看到開發者、企業和團隊如何將該模型整合到他們的工作流程和應用中。

隨著人工智慧技術的不斷進步,GPT-4.5標誌著OpenAI在追求更強大、更可靠、更符合用戶需求的語言模型道路上邁出了重要一步,為企業領域的創新帶來了新契機。

ADVERTISEMENT