馬斯克的 xAI 正式發布 Grok 3:推理能力再升級,挑戰 GPT-4o 與 Gemini

馬斯克的 xAI 正式發布 Grok 3:推理能力再升級,挑戰 GPT-4o 與 Gemini

馬斯克旗下的人工智慧公司 xAI 正式發表了最新旗艦 AI 模型 Grok3,並同步更新 iOS 及網頁版 Grok 應用程式,導入全新功能。

這款 AI 模型經過數月開發,原計劃於 2024 年發布,最後延到本週才正式亮相。xAI 表示,Grok 3 的開發運算量是其前代 Grok 2 的 10 倍,訓練數據集也大幅增加,包括法院案件文件等新內容。

Grok 3:不政治正確的 AI?

「Grok 3 的能力比 Grok 2 提升了一個量級,」馬斯克在週一的直播中表示。「這是一款追求最大程度真相的 AI,即使這個真相有時與政治正確的觀點相悖。」

一直以來,馬斯克強調 Grok 與其他 AI 的區別在於它不會刻意迎合政治正確,但過去版本的 Grok 仍在某些議題上表現出自由派的傾向。這可能與 AI 訓練數據主要來自公開網頁內容有關。馬斯克承諾將使 Grok 更加政治中立,但目前尚不清楚 xAI 是否已經實現這一目標。

此外,Grok 3 也在技術層面大幅提升,xAI 宣稱在多項 AI 基準測試中表現優異,甚至擊敗了 OpenAI 的 GPT-4o。

Grok 3 迎戰 GPT-4o!推理能力大幅提升

xAI 表示,Grok 3 在 AIME(數學問題測試)和 GPQA(博士級物理、生物和化學問題測試)等基準測試中表現優異,甚至超越 GPT-4o。此外,根據 Chatbot Arena 測試平台的早期數據,Grok 3 也展現出競爭力。

Grok 3 採用多模型架構,而非單一 AI 模型:

  • Grok 3 mini:較小版本,回應速度快,但準確性較低
  • Grok 3 Reasoning:專為推理與深度思考設計,適合數學、科學與程式設計
  • Grok 3 mini Reasoning:結合快速回應與推理能力

其中,推理模型(Reasoning) 的設計類似 OpenAI 的 o3-mini 和 DeepSeek 的 R1,這類模型在回答問題前會進行更深度的事實檢查,以減少 AI 產生錯誤資訊的機率。

用戶可以在 Grok 應用程式中啟動「Big Brain」模式,讓 AI 進行更細緻的推理,確保回答的準確性。

新功能 DeepSearch:xAI 版 AI 深度搜尋

Grok 3 推出了一項名為 DeepSearch 的新功能,這是一款 AI 驅動的資訊分析工具,競爭對手是 OpenAI 的 Deep Research。

DeepSearch 主要功能:
✔ 透過 AI 掃描網路與 X 平台,快速整理最新資訊
✔ 提供摘要與分析,讓用戶獲得精準回答
✔ 適用於數學、科學、程式設計等需要深度思考的問題

DeepSearch 進一步強化了 Grok 3 在資訊檢索方面的能力,為 AI 在日常應用與專業領域提供更強的競爭力。

SuperGrok 訂閱方案

X 平台的 Premium+ 訂閱用戶將率先獲得 Grok 3,但部分進階功能則需額外訂閱 SuperGrok。

SuperGrok 訂閱方案

  • 月費 30 美元 / 年費 300 美元
  • 享有額外推理查詢次數
  • DeepSearch 進階功能
  • 無限制圖像生成

此外,Grok 3 預計未來幾週內推出「語音模式」,讓用戶透過語音指令與 AI 互動。幾個月後,xAI 也計畫將 Grok 2 開源,延續其部分開放策略。

馬斯克表示:「當 Grok 3 成熟並穩定時,我們將開源 Grok 2。」這與 xAI 的開發模式一致,即新版本 AI 完全推出後,上一代版本將向外界開放。

馬斯克 xAI 的下一步?

Grok 3 的發佈象徵 xAI 與 OpenAI、Google、Anthropic 等 AI 公司之間的競爭進入新階段。馬斯克早在兩年前宣布 Grok,強調它將是一款「敢於挑戰主流觀點」的 AI。

然而,Grok 3 在市場上的真正競爭力,將取決於它的技術表現與商業化能力。目前 OpenAI 的 ChatGPT、Google 的 Gemini,以及 Meta 的 Llama 模型仍在市場上占據優勢,而 xAI 能否透過 X 平台的用戶優勢進一步擴展 AI 影響力,還有待觀察。

馬斯克不僅希望 Grok 3 成為最具競爭力的 AI 模型,還希望藉由 X 平台生態系統,建立 AI 驅動的資訊環境。這不僅能強化 X 的內容服務,還可能改變 AI 產品的市場格局。

資料參考來源

 

史蒂薇
作者

資深編輯,出版過上百本英語與電腦學習類書籍,參與線上遊戲雜誌《密技吱吱叫》及系列專刊《密技大牌檔》《密技大紅包》《密技冰風暴》…等企劃與執行製作,現從事科技媒體內容經營。

使用 Facebook 留言
發表回應
謹慎發言,尊重彼此。按此展開留言規則