menu-icon
anue logo
馬來西亞房產鉅亨號鉅亨買幣
search icon

A股港股

螞蟻集團重磅開源思考模型Ring-1T:推理能力直逼GPT-5天花板

鉅亨網新聞中心

螞蟻集團於正式發布上兆參數思考模型 Ring-1T,並同時全面開源模型的權重和訓練配方。Ring-1T 的問世,不僅是螞蟻集團首個上兆參數思考模型,更被視為開源 AI 正式邁入上兆參數時代的里程碑。

cover image of news article
螞蟻集團重磅開源思考模型Ring-1T:推理能力直逼GPT-5天花板(圖:shutterstock)

據《經濟通通訊社》報導,Ring-1T 在各項硬核基線測試中表現卓越。特別是在「人類偏好對齊」測試 Arena-Hard V2 中,Ring-1T 以高達 81.59% 的成功率,成功登上開源模型的榜首。此成績已直逼閉源巨頭 OpenAI 的 GPT-5-Thinking(High) 的 82.91%,顯示出開源模型已不再遙不可及地仰望閉源天花板。


頂級推理與通用能力兼具

據報導,Ring-1T 雖然被定位為「思考模型」,但其通用能力依然強勁,在綜合榜單(Arena-Hard-v2)和創意寫作(CreativeWriting-v3)上,表現與 DeepSeek、Qwen 等最新思考模型同屬開源第一梯隊。

在專業領域的測試中,Ring-1T 的推理能力尤其引人注目。它在數學競賽(AIME 25、HMMT 25)、代碼生成(CodeForces)和邏輯推理(ARC-AGI-v1)上,均取得了開源領先水平。

與此前發布的預覽版 Ring-1T-preview 相比,正式版 Ring-1T 的能力更加均衡,並在多個關鍵硬核基線上大幅提升了準確率。例如,在 Arena-hard-v2.0 上準確率提升 8.18%;在 ARC-AGI-v1 上提升 5.14%;在 OpenAI 的醫療問答 HealthBench 評測中也提升了 3.49%。

其深度推理能力更在國際頂級賽事中獲得實測驗證。在 2025 年國際數學奧賽(IMO 2025)測試中,Ring-1T 被集成到多智能體框架 AWorld 中,透過純自然語言推理,成功拿下 IMO 銀牌水平,並在一次嘗試中解決了第 1、3、4、5 題。對於最具挑戰性的幾何證明題第 2 題,它在第三次嘗試中生成了近乎完美的證明。在國際大學生程序設計競賽世界總決賽(ICPC 2025)中,Ring-1T 解決了 5 個問題,超越了 Gemini 2.5 Pro(解決 3 個問題),再次證明了其強大的編程實力。

技術創新:棒冰算法與 ASystem

Ring-1T 是基於螞蟻上兆參數通用大模型 Ling-1T 的同款架構,並在超過 20T 的高質量語料上完成預訓練。為進一步激發上兆基座的自然語言推理能力,Ring-1T 通過「LongCoT-SFT+RLVR+RLHF」多階段訓練完成全流程訓練。

在對如此龐大的上兆參數模型進行強化學習訓練時,螞蟻相關團隊進行了兩大關鍵技術創新:

1. 「棒冰」(IcePop)算法: 針對 MoE(專家混合)架構在 RL 訓練中容易遇到的訓練崩潰問題,IcePop 算法應運而生。它採用「雙向遮罩」(double-sided masking)和雙向剪裁(Double-sided clipping)的簡單而有效方法,減輕了訓練與推理精度差異帶來的有害複合效應,成功實現了長週期、長序列 RL 訓練的穩定性。

2. 高性能強化學習系統 ASystem: 為了應對上兆參數模型的 RL 訓練,螞蟻自研了 ASystem,實現了從百億到上兆規模的 RL 訓練平穩擴展。該系統採用 SingleController + SPMD 架構,並透過顯存透明卸載、跨節點顯存池化等技術,優化了上兆參數模型的顯存管理。此外,螞蟻還聯合清華大學開源了全異步強化學習訓練系統 AReaL。

實測結果:程式碼生成與邏輯推理驚豔

實測結果顯示,Ring-1T 具備處理複雜任務的能力。在前端能力測試中,Ring-1T 能夠根據提示詞生成 3D 版本的地球—火星飛行器模擬動畫網頁。在物理模擬方面,它能用 JavaScript 和 HTML5 Canvas 創建複雜的「霓虹對撞機」2D 物理模擬,且思考過程迅速、排版清晰,數學公式完美呈現。

Ring-1T 在自出題的數字密碼算術謎題(如 BASE+BALL=GAMES)中,展現了強大的邏輯推理能力,能夠進行長時間的系統化枚舉和多變量方程推理,第一步就能準確推斷出「GAMES」中的 G 等於 1。

Ring-1T 的發布,標誌著螞蟻百靈大模型正式步入 2.0 階段。螞蟻相關團隊以 IcePop、ASystem、AReaL 等一系列技術,給出了一條可複製的開源路線,證明了「思考力」能夠被工程化與規模化,強化了算力紅利向「推理紅利」的遷移。

據報導,目前 Ring-1T 已提供 HuggingFace 和 ModelScope 下載模型權重,普通用戶也可透過螞蟻百寶箱進行體驗。


section icon

鉅亨講座

看更多
  • 講座
  • 公告


    Empty
    Empty