DeepSeek深夜突襲! V3.1微信群靜默上線 R1神秘消失引爆矽谷猜想R2要來了?
鉅亨網編譯陳韋廷 綜合報導
中國 DeepSeek 周四 (22 日) 再次上演「低調震撼」,這家常讓矽谷巨頭側目的公司悄悄在微信群推送了 V3.1 版本更新,但在 X 平台等社群媒體沉默未宣傳,引發一連串疑問,因 R1 可是今年 1 月橫空出世、引爆中國開源 AI 浪潮的王牌模型,它的「隱身」瞬間點燃了業界的猜測熱潮。

這次 V3.1 升級實打實帶來了硬派提升上下文視窗直接擴展至 128K,相當於能「記住」300 頁書籍的內容,互動流暢度顯著優化,但官方反常的發布方式——僅在微信群低調官宣,且核心社群平台毫無動靜,讓外界直呼「看不懂」,而 R1 標識突然消失更讓人好奇。
R1 這個曾憑強大推理能力驚艷全球的模型,為何從聊天機器人功能中「消失」?業內人士紛紛猜測傳說中的 R2 推理模型即將接棒,還是 DeepSeek 正暗中整合產品線,計畫將多元能力收束至一個超級模型。
回顧 DeepSeek 的過往操作,從去年 12 月推出 V3,到今年 1 月發表 R1,每次出手必掀產業波瀾。這次神秘動作,被視為「暴風雨前的寧靜」。
技術方面,V3.1 採用了全新混合推理架構,支援「思考」與「非思考」雙模式統一運作。經訓練後優化,在工具呼叫、程式設計及搜尋等智能體任務上表現大幅提升,多語言程式設計基準測試 Aider 中得分超越 Anthropic 的 Claude 4 Opus,且成本優勢顯著。
與自家先前模型相比,V3.1 雖解決問題步驟更多,但透過思維鏈壓縮訓練,在任務效果持平前提下,token 消耗減少 20-50%,實際成本已與 GPT-5 mini 相當。
值得注意的是,DeepSeek 在微信公眾號介紹 V3.1 時特別提及,UE8M0 FP8 是專為下一代國產晶片設計的適配機制。
結合先前「R2 延期因國產晶片受限」的傳聞,此次 DeepSeek 主動發聲意味深長,透過採用 UE8M0 這種「範圍優先」格式,模型端做出細節精度妥協,換取國產晶片的穩定運作,而晶片廠商也能藉此合作逐步建構 FP8 生態,實現軟硬體「互相成就」。
機構分析認為,V3.1 採用的 UE8M0 FP8 Scale,正推動國產 AI 晶片、開源模型與應用形成全鏈路循環,在國產 AI 生態衝刺技術突破與落地的關鍵期,這一適配將加速國產晶片追趕國際頂尖水平的步伐。
延伸閱讀
上一篇
下一篇