GPT-4.5強勢登場！效能狂飆10倍，OpenAI執行長驚呼：像跟真人對話！

最新消息！人工智慧(AI)巨頭OpenAI週四(28日)震撼發布GPT-4.5，這款被譽為歷來最強大的大型語言模型(LLM)研究預覽版，專為聊天應用量身打造。不過，OpenAI也坦言，GPT-4.5堪稱是史上最燒錢的模型。

值得注意的是，GPT-4.5仍屬於傳統大型語言模型，而非近期備受矚目的「推理模型」。包括OpenAI、DeepSeek、Anthropic等科技大廠，都已競相推出推理模型。這類模型主打「思維鏈」或類意識流的文本生成技術，透過反思自身假設與結論，力求在回應使用者或產出內容前，抓Bug、除錯。

儘管如此，OpenAI共同創辦人兼執行長奧特曼(SamAltman)在社群平台X(前身為推特)上盛讚，GPT-4.5是「首款讓我感覺像在跟真人對話的模型。我多次驚嘆AI竟能給出真正實用的建議。」

奧特曼也提醒，由於GPU供貨吃緊，OpenAI不得不限縮GPT-4.5的存取權限。他坦言：「壞消息是：這是一款超級龐大且極度昂貴的模型。我們原планировали同步向Plus和Pro用戶全面開放，但用戶量爆量成長，導致GPU資源捉襟見肘。我們計畫下週加碼數萬顆GPU，後續將逐步向Plus訂閱用戶解鎖。（很快就會有數十萬顆GPU陸續到位，我相信大家會物盡其用，榨乾我們部署的每一顆GPU。）這並非我們理想的營運模式，但需求爆衝實在難以神準預測。」

自美東時間週四起，GPT-4.5將率先向OpenAI最頂級的訂閱服務ChatGPTPro(月費200美元)用戶開放，並同步釋出給所有付費API層級的開發者搶先體驗。OpenAI也預計在下週將服務範圍擴大至價格相對親民的Plus和Team方案(月費20/30美元)。

功能方面，GPT-4.5支援搜尋功能和畫布模式，使用者也能上傳檔案和圖片。但多模態功能(例如語音模式、影片和螢幕共享)暫時缺席，短期內恐難上線。

無監督式學習再進化AI技術大躍進

GPT-4.5代表人工智慧訓練領域的顯著突破，尤其在無監督式學習方面突飛猛進，大幅提升模型辨識模式、建立關聯及產出創新洞見的能力。

OpenAI研究人員透露，GPT-4.5透過基於較小型AI模型生成的數據進行訓練，有助於強化其「世界模型」。他們也表示，該模型同步運用多個數據中心進行預訓練，意味著它採用了類似競爭對手NousResearch的分散式方法。

這種訓練模式顯然助攻GPT-4.5學會產出更自然、更直覺的互動，同時更精準掌握使用者意圖，並展現更高竿的情商。該模型在OpenAI先前關於人工智慧擴展的研究基礎上再創高峰，進一步驗證了「增加數據和運算能力有助於提升人工智慧效能」的硬道理。

相較於前代模型及其他同級產品，GPT-4.5預估能大幅降低幻覺現象(幻覺率僅37.1%，相較之下GPT-4為61.8%)，大幅提升在處理廣泛議題時的可靠度。

GPT-4.5的殺手級特色

根據OpenAI說法，GPT-4.5旨在打造親切自然、直覺流暢的對話體驗。它對語義細微差異和上下文有更強大的掌握能力，能實現更擬人化的互動，並更有效地與使用者協作。

GPT-4.5透過擴充的知識庫和敏銳的線索解讀能力，在多個領域展現亮眼效能，包括：

——寫作輔助：優化內容、提升清晰度、激發創意

——程式設計支援：偵錯、提出程式碼改進建議、自動化工作流程

——問題解決：提供詳盡解釋，並協助制定實際決策

此外，GPT-4.5也導入全新的對齊技術，強化其對人類偏好和意圖的理解能力，進一步優化使用者體驗。

如何搶先體驗GPT-4.5？

自美東時間週四起，ChatGPTPro用戶即可在網頁、手機及桌機端的模型選擇選單中，自由選用GPT-4.5。OpenAI計畫在下週將該模型擴展至Plus和Team用戶。

針對開發者，GPT-4.5將透過OpenAI的API介面釋出，包括ChatCompletionsAPI、AssistantsAPI和BatchAPI。它完整支援函數呼叫、結構化輸出、串流傳輸、系統訊息和圖像輸入等關鍵功能，使其成為多種人工智慧驅動應用的萬用工具。不過，GPT-4.5目前尚不支援語音模式、影片或螢幕共享等多模態功能。

定價策略與企業決策影響

企業和團隊領導者可充分利用GPT-4.5帶來的多元功能。憑藉更低的幻覺率、更強的可靠性和自然流暢的對話能力，GPT-4.5有望助攻各行各業升級轉型：

——優化客戶互動：企業可將GPT-4.5整合至客服系統，實現更即時、更自然的互動，同時降低錯誤率

——強化內容生成：行銷和公關團隊可高效產出高品質、符合品牌調性的內容

——精簡營運流程：AI驅動的自動化功能，可助攻偵錯、優化工作流程並輔助策略決策

——高擴展性與客製化：API介面讓企業能量身打造，客製化符合特定需求的AI解決方案

然而，對於有意透過GPT-4.5開發應用的第三方開發者而言，GPT-4.5的API定價貴到嚇人，每百萬tokens輸入/輸出要價75美元/180美元，相較之下，GPT-4o的定價僅2.50美元/10美元。

隨著其他競品模型接連問世，例如Anthropic的Claude3.7、Google的Gemini2Pro，以及OpenAI自家的推理「o」系列(o1、o3-miniHigh、o3)，GPT-4.5的效能提升是否足以彌補其高昂成本，尤其是在透過API串接使用時，將成為後續值得關注的焦點。

AI研究人員與資深用戶早期反應褒貶不一

GPT-4.5的發布在社群平台上掀起AI研究人員和科技愛好者的熱烈討論，尤其在該模型的「系統卡」(systemcard，即概述其訓練和評估的技術文件)提前外洩後，文件中意外曝光一系列官方公告前的基準測試結果。

OpenAI在外洩事件後發布的最終版系統卡，與外洩版本存在顯著差異，刪除了外洩版中「GPT-4.5並非前沿模型，但它是OpenAI規模最大的LLM，運算效率較GPT-4提升10倍以上」的說法。OpenAI發言人表示，這種說法並不精確。

人工智慧模型供應商NousResearch的共同創辦人Teknium(化名)對OpenAI的新模型表示失望，直言在多語言理解(MMLU)和實際編碼基準測試中，GPT-4.5相較其他領先的大型語言模型(LLM)，進步幅度微乎其微。Teknium質疑：「距離GPT-4發布已經超過2年，OpenAI投入的資金規模擴大上千倍……究竟發生了什麼？」

此外，有人認為，GPT-4.5在軟體工程基準測試中表現遜於o3-mini，這讓人質疑這次發布是否代表了真正的技術進步。

然而，也有部分用戶為GPT-4.5的潛力辯護，認為其價值不應僅僅仰賴基準測試的結果。

軟體開發人員Haider(@slow_developer)強調，GPT-4.5相較GPT-4在運算效率上提升了10倍，且其在綜合任務處理能力上優於OpenAI專注STEM領域的o系列模型。

AI新聞發布者AndrewCurran(@AndrewCurran_)則從定性角度出發，預測GPT-4.5將在寫作和創造性思維領域樹立新標竿，並盛讚其為OpenAI的「傑作」。

這些討論凸顯了人工智慧領域一個更廣泛的爭論：技術進步是否應單純透過基準測試來衡量，還是應更側重於推理能力、創造力和擬人化互動等定性方面的改進？

仍處於研究預覽階段

OpenAI將GPT-4.5定位為研究預覽版，以深入了解其優勢與局限性。該公司表示，將持續探索用戶與模型的互動方式，並挖掘非常規應用場景。

OpenAI聲稱：「我們發布GPT-4.5作為研究預覽版，以更深入了解其優勢與局限性。擴展無監督式學習將持續推動人工智慧的進步，提升準確性、流暢性和可靠性。」

隨著OpenAI不斷精進其模型，GPT-4.5為未來的人工智慧進步奠定了基礎，尤其是在推理和工具使用代理方面。儘管GPT-4.5已展現令人印象深刻的能力，OpenAI仍積極評估其在生態系統中的長期角色。

憑藉更廣泛的知識庫、更高的情商和更自然的對話能力，GPT-4.5將為各領域的用戶帶來顯著改進。OpenAI期待看到開發者、企業和團隊如何將該模型整合到他們的工作流程和應用中。

隨著人工智慧技術的不斷進步，GPT-4.5標誌著OpenAI在追求更強大、更可靠、更符合用戶需求的語言模型道路上邁出了重要一步，為企業領域的創新帶來了新契機。