menu-icon
anue logo
熱門時事鉅亨號鉅亨買幣
search icon


美股

年費高達3000美元!馬斯克 Grok4成史上最貴AI 號稱全領域輾壓博士

鉅亨網新聞中心


馬斯克最近發布了最新的人工智慧產品——Grok 4,並聲稱這款 AI 將「重寫人類知識庫」,成為世界上最聰明的人工智慧。

cover image of news article
(圖:REUTERS/TPG)

在這次發布會上,馬斯克的言辭依然強硬,並強調 Grok 4 的智力水平已經超越博士級別。 Grok 4 的年訂閱價格高達 3000 美元,成為市場上最昂貴的 AI 產品,引起了廣泛關注。


Grok 的訓練分為預訓練與強化學習兩個主要階段。從 Grok 2 到 Grok 3 的過程中,主要依賴預訓練,而 Grok 4 則大幅引入以推理能力為核心的強化學習訓練。與 Grok 2 相比,Grok 4 的訓練計算量提升了整整兩個數量級,達到 100 倍的成長,顯示出其強大的計算能力。

馬斯克表示,儘管 Grok 4 目前尚不具備發明新理論或提出原創技術的能力,但他預測到今年年底,Grok 可能就能夠發明新技術,而明年將幾乎確定具備發現新物理規律的能力。 Grok 的設計概念是與人形機器人 Optimus 結合,形成一個閉環推理系統,這將開啟一個智慧大爆炸的時代。

在產品形態上,Grok 4 是單智慧體模型,而 Grok 4 Heavy 則是多智慧體版本,支援多個智慧體並行思考。 Grok 4 Heavy 在現場演示中展示了其強大的預測能力,能夠評估洛杉磯道奇隊在今年 MLB 世界大賽中的冠軍機率為 21.6%。此外,它還能從 X 平台資料庫中自動抓取資料,找出 xAI 團隊中最奇怪的頭像。

Grok 不僅具備推理與搜尋能力,還能產生內容時間軸,幫助用戶一目了然地了解多個 AI 模型的基準測試成績及更新節奏。目前,Grok 在多模態理解能力上仍有待加強,尤其是在圖像理解和生成方面。下一階段的基礎模型訓練已經在進行中,預計將在幾週內完成。

根據 xAI 的數據,Grok 4 在不使用任何工具的情況下,在「人類最後的考試」(HLE)中得分為 25.4%,超過了 Google Gemini 2.5 Pro 的 21.6% 和 OpenAI o3 的 21%。使用工具後,Grok 4 Heavy 的得分達到 44.4%,遠高於 Gemini 2.5 Pro 的 26.9%。在視覺推理類基準測試 ARC-AGI-2 中,Grok 的得分為 16.2%,幾乎是排名第二的 Claude Opus 4 的兩倍。

在博士級難度的問題集中,Grok 4 Heavy 也取得了滿分,展現出其強大的推理與理解能力。在多項編程相關測試中,Grok 4 Heavy 的表現同樣優異,顯示出技術優勢。

馬斯克強調,未來 Grok 將幾乎能在所有考試中答對每一個問題,而當它無法回答某個問題時,會指出題目的錯誤或含糊之處,並給出不同情境下的可能答案。這意味著傳統考試的意義將會減弱,AI 的唯一檢驗標準將是其在現實世界中的應用能力。

目前,Grok 4 和 Grok 4 Heavy 已經全面上線,雖然其高達 3000 美元的年訂閱價格引發了不少用戶的吐槽,但也讓人對其性能充滿期待。馬斯克在發布會中提到,Grok Voice 這一全新語音助手不僅能回答問題,還能表達情緒,甚至能現場唱歌,顯示出 AI 技術的進步。

隨著 Grok 4 的發布,市場對其未來的發展充滿期待,尤其是在多模態能力和視頻生成等方面的潛力,將可能顛覆我們對人工智慧的認知。



Empty