V4快來了?DeepSeek網頁上線快速與專家雙模式 首次引入模式分層設計、擅長處理複雜問題
鉅亨網編譯陳韋廷 綜合報導
中國國產大模型企業 DeepSeek 周三 (8 日) 在其官方產品端迎來重要更新,首次引入「模式分層」設計,在輸入框上方新增「快速模式」與「專家模式」兩個選項。這變動被視為 DeepSeek 在使用者互動層面的重大升級,迅速引發產業關注。

綜合《澎湃新聞》、《每日經濟新聞》等陸媒報導,DeepSeek 快速模式定位為「日常助手」,強調即時回應,支持圖片與文件內的文字識別,適合處理輕量級任務,專家模式則專為複雜問題設計,強調深度思考與智能搜索,具備領域深度增強、多步推理可視化、引用溯源強化等特點。
根據官方披露,專家模式背後由下一代混合專家模型 (MoE) 架構支撐,核心底座為 DeepSeek-V3.2(或其後繼版本),並融合 DeepSeek-R1 的強化學習成果,在保留長思維鏈推理能力的同時,針對專業領域進行了定向蒸餾和微調。
儘管官方平台日誌顯示,目前對外公佈的模型版本仍為 2025 年 12 月更新的 DeepSeek-V3.2,但此次模式升級讓外界對 V4 的猜測再度升溫。
綜合多方資訊,DeepSeek 預計本月正式上線 V4 版本。此前,3 月 29 日至 31 日,DeepSeek 官網、App 及 API 連 3 天出現異常,累計當機超 10 小時,外界普遍猜測這是 V4 上線前的壓力測試。對此,DeepSeek 內部人士僅以「非常期待」回應。
今年以來,DeepSeek 在技術上動作頻頻。1 月,北大與 DeepSeek 共同發布新論文,提出「條件記憶」概念以優化大模型記憶短板,隔月在網頁端被曝測試支持 1M 上下文的新結構。
根據中國券商最新研報,DeepSeek-V4 將聚焦國產化技術創新,可望在演算法與工程層面進一步縮小中國大模型產業與全球的差距,但要在競爭白熱化的市場中復刻去年的「炸場」效應,挑戰巨大。
- 免費體驗5萬美元模擬交易 投資全球資產
- 掌握全球財經資訊點我下載APP
- 講座
- 公告
上一篇
下一篇