左手剛剛?cè)谫Y,右手就發(fā)大模型,馬斯克重金打造的Grok 4,正式面世!
7月10日,特斯拉創(chuàng)始人兼首席執(zhí)行官馬斯克旗下的人工智能公司xAI正式發(fā)布了Grok 4。在將近1小時的發(fā)布會直播中,xAI發(fā)布了這個系列的兩款模型,分別是Grok 4(單智能體版本)和Grok 4 Heavy(多智能體版本),其中后者支持4個智能體并行思考,在推理過程中橫向比對、縱向協(xié)同,調(diào)用更大規(guī)模的計算資源以完成更復雜、更精密的任務(wù)。
作為xAI在2023年推出首代大模型以來的第四次重要更新,Grok 4在“人類的最后考試”(Humanity's Last Exam)取得了25.4%的準確率,超過了谷歌Gemini 2.5 Pro的21.6%和OpenAI o3(高版本)的21%,被稱為“世界上最強AI模型”。
據(jù)xAI的研究人員介紹,Humanity's Last Exam測試總共有2500個問題,包括數(shù)學、自然科學、工程以及所有人文學科,問題廣泛且都是博士甚至高級研究水平,極具挑戰(zhàn)性,但Grok 4在這些問題上都可以得到很好的分數(shù)。
“在所有學科上,Grok 4比博士還強——沒有例外?!瘪R斯克在直播中表示,雖然Grok 4目前還沒有發(fā)現(xiàn)新科學或新的物理定律,但這只是一個時間問題,他相信Grok 4可以在今年內(nèi)實現(xiàn)科學新發(fā)現(xiàn)。
此外,據(jù)發(fā)布會披露,在GPQA、AIME25、LCB(Jan-May)、HMMT25等多項測評中,Grok 4都超越了OpenAI o3、Gemini 2.5 Pro、Claude 4 Opus等模型。
價格方面,Grok 4目前僅對付費用戶開放。輸入每100萬tokens價格為3美元,輸出每100萬tokens價格為15美元。值得注意的是,xAI還推出了迄今為止最昂貴的AI訂閱計劃——每月300美元的Super Grok Heavy,這一價格也超過了OpenAI最貴的200美元Pro會員月費。
業(yè)內(nèi)人士分析稱,從Grok 2到Grok 3,再到如今的Grok 4,xAI的訓練計算量實現(xiàn)了驚人的百倍增長。發(fā)布會披露,Grok 4的訓練是在一個擁有超過20萬張H100 GPU的超級計算機集群上完成的,是Grok 3時期的兩倍。更重要的是,xAI改變了訓練策略,將更多的算力投入到“推理能力”的專項訓練上。相比于Grok 2,Grok 4的訓練量提升了整整100倍。
因此,Grok 4所取得的優(yōu)異性能,離不開馬斯克“燒錢”打造的超級計算機集群的算力支撐。2024年6月,xAI宣布在美國田納西州孟菲斯建造超級計算機以訓練其人工智能大模型Grok。該系統(tǒng)初期配備20萬個英偉達GPU,馬斯克還計劃將GPU規(guī)模最終擴大到100萬個。這一項目已投入數(shù)億美元,未來仍需持續(xù)投入大量資金。
值得注意的是,一周以前,xAI剛剛完成了100億美元的融資,其中包括50億美元債務(wù)融資和50億美元股權(quán)融資。在本輪融資中,摩根士丹利擔任了50億美元債務(wù)融資的顧問,并表示其債務(wù)融資獲得超額認購,吸引了全球債務(wù)投資者參與。摩根士丹利強調(diào),xAI還另外獲得了50億美元戰(zhàn)略股權(quán)融資,“債務(wù)與股權(quán)組合有效降低綜合資本成本,大幅拓展xAI的可融資渠道”。
高昂的算力支出讓xAI承受著巨大的成本壓力。據(jù)外媒援引消息人士報道,xAI目前每月“燒錢”高達10億美元,其在構(gòu)建先進大模型方面的成本遠遠超過收入增長。對于這一報道,馬斯克曾公開表示,這類巨額虧損在整個人工智能行業(yè)并不罕見,主要源自高昂的服務(wù)器建設(shè)和芯片采購成本。
在AI大模型的競賽中,融資與技術(shù)研發(fā)猶如車之兩翼,只有充足的資金儲備才能支撐高成本的技術(shù)研發(fā),只有技術(shù)持續(xù)取得突破才能支撐進一步的融資。在Grok 4發(fā)布不久前,OpenAI也透露了可能在今年夏天發(fā)布GPT-5。不可否認,Grok 4是xAI發(fā)展過程中的又一個里程碑,但追逐AGI的道路依然漫長。在馬斯克慶祝Grok 4取得的卓越成績時,下一個“最強AI模型”或許已經(jīng)在路上。