極佳視界發布GigaWorld-Policy 刷新世界模型性能紀錄 數據領先Google、輝達
鉅亨網新聞中心
中國具身智能領軍企業極佳視界 (GigaAI) 近日發布多項重量級成果,象徵著機器人高頻實時閉環控制進入新紀元。據陸媒《新浪財經》報導,其全新發布的「世界 - 動作模型」(World-Action Model,簡稱 WAM)——GigaWorld-Policy,在推理速度與訓練效率上均實現 10 倍提升,真機任務成功率更暴漲 30%,引發行業高度關注。

「以動作為中心」架構
據報導,傳統的世界 - 動作模型在推理時需同時生成視覺畫面與動作,跨模態的深度耦合導致計算延遲極高。GigaWorld-Policy 創新性地提出「以動作為中心」的模型範式,將視覺觀測、機器人狀態及動作序列映射到統一嵌入空間,並採用「訓繁推簡」的混合策略。
在訓練階段,模型引入因果掩碼機制,利用未來視覺動態提供高密度監督信號;而在推理階段,則果斷捨棄沉重的視頻預測分支,僅保留輕量化動作生成模組。這種設計讓推理速度飆升 10 倍,並顯著降低了顯存佔用,為工業級大規模部署鋪平道路。
三段式訓練法與權威評測奪冠
為極致挖掘數據價值,GigaWorld-Policy 採用了三段式高效訓練流程:從海量互聯網視頻的通用物理預訓練,到數千小時具身場景的沉浸式微調,最後通過極小樣本完成動作對齊。相較於傳統視覺語言動作模型 (VLA),整體訓練效率提升了 10 倍。
此外,極佳視界的另一力作 GigaWorld-1 在世界模型頂級評測基準 WorldArena 中,擊敗 Google、輝達、阿里等科技巨頭,榮登全球榜首。該模型成為榜單中唯一綜合得分突破 60 分的模型,在視覺真實性、幾何精準度及物理準確性上展現出斷層式領先。
技術上,它融合了顯式動作建模與可微分物理引擎,能真實模擬複雜的物理交互過程。
真機實測驚艷,雙輪驅動戰略成效顯著在真機實測中,GigaWorld-Policy 的平均成功率接近 85%,較對比模型提升超過 30%。其毫秒級的響應能力使其能有效應對現實環境中的動態干擾。
同時,具身基礎模型 GigaBrain-0.5M* 在折紙盒、咖啡製備等高難度長時程任務中,實現了接近 100% 的成功率。
極佳視界能取得如此突破,得益於其「世界模型 × 具身大腦」的雙輪驅動戰略及強大的技術底蘊。該公司近期完成近 10 億元 Pre-B 輪融資,投資方包括中芯聚源、上海半導體產投基金等產業資本,此前更獲得華為哈勃投資的戰略加持。
開源賦能與未來展望
極佳視界積極推動生態建設,GigaWorld-1 的核心代碼已開源,在 Huggingface 平台半個月內下載量便突破 1.6 萬次。公司表示,將持續引領從數據引擎到閉環仿真器的技術躍升,為通用人工智能 (AGI) 走進物理世界打造最堅實的基石。
延伸閱讀
- UniPat AI發布Echo預測智慧系統 EchoZ-1.0登頂全球通用預測智慧榜單
- 內部人士正逢低買入軟體股!「這兩支」股票釋信心訊號
- 馬斯克Terafab晶圓廠難挑戰台積電!美銀點出「三大」障礙
- 方舟「木頭姐」賣Meta躲過暴跌!反手買入「這檔」AI股
- 講座
- 公告
下一篇