馬斯克的新模型Grok2宣稱打敗 GPT-4o、Claude3.5 Sonnet，他把AI煉成啥樣了？ | T客邦

半導體/電子產業 5G/網路 AI/大數據電動車/交通

加密貨幣/區塊鏈遊戲/電競雲端/資訊安全商業/金融

尖端科技 3C新品趨勢

抽獎/得獎公告體驗試玩活動課程講座

2024科技趨勢金獎

馬斯克的新模型Grok2宣稱打敗 GPT-4o、Claude3.5 Sonnet，他把AI煉成啥樣了？

前段時間，大型語言模型競技場上，一個程式碼為 sus-column-r 的匿名模型橫空出世。沒人知道它師出何門，但在過去的一個月裡，它卻稱得上是過關斬將……累計一萬多人的投票，硬生生讓它擠進了排行榜前列。到現在，綜合能力已經和 5 月 13 號發的 GPT-4o （ API 版本）並列第三了。

看這勢頭，當時就有不少人猜測，這可能是 OpenAI 那個遲遲沒公佈的，神秘的「草莓 Q* 」項目。

然而，前兩天這個困擾大夥兒很久的謎語，終於有答案了。但它不是 OpenAI ，而是經常被大家忽略，但也在搞 AI 的馬斯克。

這個匿名的 sus-column-r 模型，其實就是 xAI 要推出的新模型 Grok2 ，現在已經上線付費會員版的 X 了。

在官方推出 Grok2 的部落格裡，明晃晃地展示了之前 sus-column-r 積累的戰績，甚至還做了對戰勝率表。

按照他們自個兒的說法，表上除了 Google 的 Gemini 1.5 Pro 外，其餘無論是 GPT-4o ，還是 Claude3.5 Sonnet ，都只能是 Grok2 的「手下敗將」。

當然了，其他的紙上成績， Grok2 答得也挺不錯。光從各個基準的資料來看，它的各項能力，都和市面上最先進的 AI 差不多，這一線大型語言模型的行列，也算是被 Grok 給擠進去了。

不過一個模型好不好，光看這些資料也還不行，最重要的是，得看大夥們的實際使用體驗。

相較於上次的還只能文字開開玩笑的 Grok1.5 ，這次 Grok2 最明顯的一個升級，就是新增了圖片生成功能。不過，與其他家自己動手搞多模態 AI 不一樣，這次馬斯克倒挺罕見地選擇了和別人合作： FLUX.1 。

但沒想到內建到 Grok2 裡面的 FLUX.1 ，還真撞出了一點不一樣的火花。

倒也不是說在性能上它一夜之間飆升了一大截。而是相較於市面上的其他圖片 AI ， Grok2 在「尺度」上面，可以稱得上是一騎絕塵。

同樣是迪士尼公主的一個提示詞， Grok2 在尺度上就比其他模型要大膽的多。

而且， Grok2 還能直接對著自己的老闆惡搞，比如這是一個愛吃甜品，吃到發胖的馬斯克。

不過， Grok2 這麼肆無忌憚地惡搞各種公眾人物、卡通人物，風險肯定還是有的。

像是有網友生成瑪利歐抽菸喝酒、觀望 911 事件的圖片，就已經有人督促任天堂起訴了。

另外，按照官方給的資料，這次 Grok2 在數學這塊領域，也能算得上一絕。比如之前 Grok 做錯過的一道問題，再拿來給 Grok2 試試。

結果馬斯克還真沒騙人，它把這道題給解決了。

偷 X 資料、拿特斯拉顯卡所練成的 AI

而把 Grok 練成現在的模樣，馬斯克在背後出的力可不止一星半點兒。

但有意思的是，馬斯克主打的，就是把自己其他公司的資源「乾坤大挪移」。

先是員工這部分，xAI 總共就只有 50 來個員工，其中有 11 個都是在特斯拉工作的，而且裡面還有 6 個是在 Autopilot 團隊工作的，是一點兒都不想避嫌。

據華爾街日報消息，甚至原本要給特斯拉用的 GPU ，也被馬斯克要求優先供應給 xAI ，還冠冕堂皇的說，特斯拉現在也沒地方用，放著也是放著。

偷完特斯拉的家，還不過癮，馬斯克把手也伸到了 X 上。

就在前兩天，科技媒體 Techcrunch 稱，為了「悄悄」用使用者們的資料訓練 AI ， X 在更新的時候，還默默把用戶的預設設定給改了，而且要關掉還得專門登錄網頁版……

不過總這麼偷，難免會吃上官司。像是馬斯克和他的 X ，就被特斯拉的股東，還有好幾個國家的資料保護機構給起訴了。

而另外幾個資料保護機構，也把 X 告得暫停用使用者資料訓練 Grok 了。甚至 X 還有可能遭到「4%平台營業額」的罰款。

但無論如何，在大型語言模型這塊，馬斯克的 Grok 和其他大型語言模型相比，不管是圖片生成，還是其他基礎能力上， Grok2 都不算差，甚至還搞出了一點自己的特色。

據說，xAI 下一步會把 Grok 更深入地揉到 X 平台上面，而且還要再發一個多模態理解的預覽版 AI 。

馬斯克會把 AI 搞成什麼樣，還是值得期待的。

延伸閱讀：買了10萬張NVIDIA GPU就要好好用，馬斯克宣佈「世界最強AI」Grok-3 已經開始訓練
延伸閱讀：馬斯克預告用了10萬張NVIDIA H100卡來訓練Grok 3，預計年底上線
延伸閱讀：Adversa AI LLM 紅隊測試：不用越獄 xAI Grok 就會告訴你「如何做炸彈」
延伸閱讀：馬斯克版 ChatGPT 「Grok」，用起來和它老闆一樣嘴賤愛酸人

#xai #人工智慧 #ai #馬斯克 #openai #gpt-4 #grok #大型語言模型 (llm)#資料隱私 #ai 訓練 #圖片生成 #多模態 ai

送【10個ChatGPT的好工具】電子書 Line brand icon

使用 Facebook 留言

謹慎發言，尊重彼此。按此展開留言規則