電子發(fā)燒友網(wǎng)報道(文/莫婷婷)7月10日,馬斯克的AI公司xAI正式發(fā)布旗艦大模型Grok 4、Grok 4 API,同時推出AI訂閱計劃Super Grok Heavy,每月300美元(約合2153元人民幣)。
馬斯克對Grok 4的能力給予了高度評價,他表示,Grok 4的推理能力已超越人類水平,甚至比幾乎所有學(xué)科的研究生具備更強(qiáng)的綜合理解與分析能力。
在被稱為“人類的最后考試”(Humanity's Last Exam)的綜合性測試中,Grok 4取得了25.4%的準(zhǔn)確率,且完全不依賴任何外部“工具”輔助。相比之下,谷歌Gemini 2.5 Pro的得分為21.6%,而OpenAI的o3(高版本)僅為21%。在這場全球頂尖模型的較量中,Grok 4一舉超越了多位此前公認(rèn)的領(lǐng)先選手,成為新一代大模型中的佼佼者。

除了Humanity's Last Exam的測試,Grok 4還在GPQA、AIME25、LCB(Jan-May)、HMMT25等測試中,超過了OpenAI o3、Gemini 2.5 Pro、Claude 4 Opus等大模型。
馬斯克介紹,Grok 4未來將達(dá)到以下目標(biāo):它能在所有考試中答對所有題目;如果答錯,它會指出問題出在哪里;如果題目存在歧義,它會將問題拆解為答案A、B和C,并消除歧義后的問題下,對選項A、B、C分別對應(yīng)的解答。
馬斯克表示,Grok 4每個學(xué)科都達(dá)到超博士水平,目前Grok 4還沒有發(fā)明新技術(shù)或發(fā)現(xiàn)新物理定律的能力,但他認(rèn)為在下半年、最遲也會在明年就能看到Grok 4發(fā)現(xiàn)具有實用價值的新技術(shù),兩年之內(nèi)就會發(fā)現(xiàn)新物理定律。
Grok 4是如何實現(xiàn)如此高水平的推理能力。根據(jù)介紹,在訓(xùn)練層,每一代模型的訓(xùn)練規(guī)模都實現(xiàn)了數(shù)量級提升,Grok 4的訓(xùn)練量是Grok 2的100倍。馬斯克明確表示,這個訓(xùn)練量還會持續(xù)增長。

訓(xùn)練算力有兩種類型:一是Grok 2到Grok 3階段的訓(xùn)練預(yù)算力,二是在Grok 3到Grok 4階段,團(tuán)隊在強(qiáng)化學(xué)習(xí)的推理環(huán)節(jié)投入了大量算力。xAI團(tuán)隊通過訓(xùn)練Grok 2,首次實現(xiàn)了預(yù)訓(xùn)練規(guī)模的突破,團(tuán)隊發(fā)現(xiàn)如果真正精細(xì)地進(jìn)行數(shù)據(jù)消融實驗,以及基礎(chǔ)設(shè)備、算法,就可以通過1.0倍的量大幅推進(jìn)預(yù)訓(xùn)練,打造最佳的預(yù)訓(xùn)練基礎(chǔ)模型。xAI將動用了有20萬塊H100 GPU的超級算力中心。
與Grok 3不同,Grok 4將工具直接融入訓(xùn)練過程,使其成為模型的原生能力。在單智能體情況下,團(tuán)隊能解決40%的問題;隨著測試與計算規(guī)模的擴(kuò)大,團(tuán)隊已經(jīng)能解決HRE問題中純文本子集超過50%的內(nèi)容。這是一個極其困難的任務(wù),xAI表示。
在發(fā)布會上,xAI也正式推出了多智能體版本Grok 4 Heavy。在人類的最后考試測試中,Grok 4 Heavy取得44.4%的準(zhǔn)確率。
馬斯克指出Grok最大的弱點在圖像理解、圖像生成,xAI正在進(jìn)行相關(guān)的訓(xùn)練。Grok 4基于第六代基礎(chǔ)模型,第七代基礎(chǔ)模型將在幾周后完成,屆時將改善圖像領(lǐng)域的不足。
在開通AI訂閱計劃Super Grok后,用戶就可以訪問Grok 4,訂閱費(fèi)為每月30美金。如果成為Super Grok Heavy用戶,就可以同時訪問Grok 4和Grok 4 Heavy,訂閱費(fèi)為每月300美金。xAI表示,屆時你將成為“一群Grok研究智能體的任務(wù)主管”,讓你變得更聰明。
Grok 4以其超人類推理能力與跨學(xué)科統(tǒng)治力引發(fā)關(guān)注。此次發(fā)布不僅讓Grok 4成為大模型性能天花板,也意味著xAI正以算力筑壁壘。
-
大模型
+關(guān)注
關(guān)注
2文章
3648瀏覽量
5179
發(fā)布評論請先 登錄
解決AI電荒難題!馬斯克:SpaceX并購xAI,把AI送上太空
馬斯克要發(fā)100萬顆衛(wèi)星,是太空狂想還是未來藍(lán)圖?
銷量首度被比亞迪超越,馬斯克卻要帶特斯拉“去造機(jī)器人”?
馬斯克:AI5芯片設(shè)計進(jìn)展順利,特斯拉AI戰(zhàn)略邁入新階段
當(dāng)光伏飛向太空:霍爾電流傳感器如何守護(hù)馬斯克的100GW“天基電網(wǎng)”?
2026年,人類文明重構(gòu)的元年 | 馬斯克的預(yù)言
馬斯克點贊晶科能源最新電池轉(zhuǎn)換效率世界紀(jì)錄
看點:馬斯克:將深度參與特斯拉芯片設(shè)計 華為首款透明天線路由器開售
特斯拉要自建超大型晶圓廠,馬斯克:與英特爾合作 “有必要”
NVIDIA黃仁勛向SpaceX馬斯克交付DGX Spark
馬斯克腦機(jī)接口革命:意念能控制機(jī)器人!癱瘓者“重生”,失明者“復(fù)明”
訓(xùn)練量暴增100倍!Grok 4推理碾壓,馬斯克預(yù)言兩年內(nèi)發(fā)現(xiàn)新物理定律
評論