前段時間,大型語言模型競技場上,一個程式碼為 sus-column-r 的匿名模型橫空出世。沒人知道它師出何門,但在過去的一個月裡,它卻稱得上是過關斬將……累計一萬多人的投票,硬生生讓它擠進了排行榜前列。到現在,綜合能力已經和 5 月 13 號發的 GPT-4o ( API 版本 )並列第三了。
看這勢頭,當時就有不少人猜測,這可能是 OpenAI 那個遲遲沒公佈的,神秘的「 草莓 Q* 」項目。
然而,前兩天這個困擾大夥兒很久的謎語,終於有答案了。但它不是 OpenAI ,而是經常被大家忽略,但也在搞 AI 的馬斯克。
這個匿名的 sus-column-r 模型,其實就是 xAI 要推出的新模型 Grok2 ,現在已經上線付費會員版的 X 了。
在官方推出 Grok2 的部落格裡,明晃晃地展示了之前 sus-column-r 積累的戰績,甚至還做了對戰勝率表。
按照他們自個兒的說法,表上除了 Google 的 Gemini 1.5 Pro 外,其餘無論是 GPT-4o ,還是 Claude3.5 Sonnet ,都只能是 Grok2 的「手下敗將」。
當然了,其他的紙上成績, Grok2 答得也挺不錯。光從各個基準的資料來看,它的各項能力,都和市面上最先進的 AI 差不多,這一線大型語言模型的行列,也算是被 Grok 給擠進去了。
不過一個模型好不好,光看這些資料也還不行,最重要的是,得看大夥們的實際使用體驗。
相較於上次的還只能文字開開玩笑的 Grok1.5 ,這次 Grok2 最明顯的一個升級,就是新增了圖片生成功能。不過,與其他家自己動手搞多模態 AI 不一樣,這次馬斯克倒挺罕見地選擇了和別人合作: FLUX.1 。
但沒想到內建到 Grok2 裡面的 FLUX.1 ,還真撞出了一點不一樣的火花。
倒也不是說在性能上它一夜之間飆升了一大截。而是相較於市面上的其他圖片 AI , Grok2 在「尺度」上面,可以稱得上是一騎絕塵。
同樣是迪士尼公主的一個提示詞, Grok2 在尺度上就比其他模型要大膽的多。
而且, Grok2 還能直接對著自己的老闆惡搞,比如這是一個愛吃甜品,吃到發胖的馬斯克。
不過, Grok2 這麼肆無忌憚地惡搞各種公眾人物、卡通人物,風險肯定還是有的。
像是有網友生成瑪利歐抽菸喝酒、觀望 911 事件的圖片,就已經有人督促任天堂起訴了。
另外,按照官方給的資料,這次 Grok2 在數學這塊領域,也能算得上一絕。比如之前 Grok 做錯過的一道問題,再拿來給 Grok2 試試。
結果馬斯克還真沒騙人,它把這道題給解決了。
偷 X 資料、拿特斯拉顯卡所練成的 AI
而把 Grok 練成現在的模樣,馬斯克在背後出的力可不止一星半點兒。
但有意思的是,馬斯克主打的,就是把自己其他公司的資源「乾坤大挪移」。
先是員工這部分,xAI 總共就只有 50 來個員工,其中有 11 個都是在特斯拉工作的,而且裡面還有 6 個是在 Autopilot 團隊工作的,是一點兒都不想避嫌。
據華爾街日報消息,甚至原本要給特斯拉用的 GPU ,也被馬斯克要求優先供應給 xAI ,還冠冕堂皇的說,特斯拉現在也沒地方用,放著也是放著。
偷完特斯拉的家,還不過癮,馬斯克把手也伸到了 X 上。
就在前兩天,科技媒體 Techcrunch 稱,為了「悄悄」用使用者們的資料訓練 AI , X 在更新的時候,還默默把用戶的預設設定給改了,而且要關掉還得專門登錄網頁版……
不過總這麼偷,難免會吃上官司。像是馬斯克和他的 X ,就被特斯拉的股東,還有好幾個國家的資料保護機構給起訴了。
而另外幾個資料保護機構,也把 X 告得暫停用使用者資料訓練 Grok 了。甚至 X 還有可能遭到「4%平台營業額」的罰款。
但無論如何,在大型語言模型這塊,馬斯克的 Grok 和其他大型語言模型相比,不管是圖片生成,還是其他基礎能力上, Grok2 都不算差,甚至還搞出了一點自己的特色。
據說,xAI 下一步會把 Grok 更深入地揉到 X 平台上面,而且還要再發一個多模態理解的預覽版 AI 。
馬斯克會把 AI 搞成什麼樣,還是值得期待的。
請注意!留言要自負法律責任,相關案例層出不窮,請慎重發文!