鉅亨網新聞中心
DeepSeek 於 2026 年 4 月下旬發布旗艦級開源模型 DeepSeek-V4,其參數規模達 1.6 兆。該模型包含 V4-Pro 與 V4-Flash 兩個版本,原生支援百萬 token 超長上下文。在性能定位上,技術報告顯示 V4-Pro 的基準測試表現優於 GPT-5.2 與 Gemini-3.0-Pro,但與全球頂尖模型 GPT-5.4 相比,仍存在約 3 至 6 個月的技術差距。
這款模型的登場不僅是性能的展示,更是創始人梁文鋒對中國 AI 產業鏈的一場壯烈「探路」。據陸媒報導,在模型性能追求「第一梯隊」的商業常規下,梁文鋒選擇了一條反商業直覺的道路:冒著排名下滑與淪為二流的風險,為國產算力趟出一條生路。
這場探路的代價是極其沈重的。為了這次轉向,DeepSeek 面臨了三大危機:首先是人才流失,核心成員如羅福莉、郭達雅等相繼被小米、字節、騰訊挖走;其次是市場蠶食,字節的「豆包」與月之暗面的「Kimi」趁虛而入搶占日活;最後是原則妥協,梁文鋒被迫打破「不融資」鐵律,啟動超 100 億美元估值的融資以支撐昂貴的國產算力研發成本。
在研發過程中,DeepSeek 創始人梁文鋒採取了側重技術適配的戰略選擇。為了解決大模型從 NVIDIA 的 CUDA 生態遷移至國產算力平台的兼容性問題,研發團隊耗時約 5 個月,重寫了 40 萬行算子。此舉實現了兆級參數模型在華為昇騰(Ascend)CANN 架構上的全棧跑通。
數據顯示,經深度優化後,V4 在昇騰晶片上的推理速度較初期版本提升了 35 倍,且與 CUDA 代碼的兼容性達到 95%。
此項技術路徑的確立對中國 AI 產業鏈產生了影響。在 V4 發布當日,包含寒武紀、海光、摩爾線程在內的 8 家國產 AI 晶片廠商相繼宣布完成適配。市場動態顯示,阿里、字節跳動與騰訊等企業已累計向華為訂購數十萬顆昇騰 950PR 晶片,顯示技術堆棧正加速轉向自主化。
中國信通院亦隨之啟動 DeepSeek-V4 國產化適配測試,評測範圍覆蓋晶片、伺服器及開發工具鏈等全棧產品。
然而,側重底層適配的研發模式也伴隨相關成本。由於更新頻率在一段時間內相對放緩,DeepSeek 面臨部分核心技術人才流失至小米、字節跳動及騰訊等企業的挑戰。市場數據指出,在競爭產品如「豆包」與「Kimi」的壓力下,DeepSeek 的用戶增長曲線已趨於平緩。
此外,由於 V4 的單輪訓練成本飆升至約 5 億美元,較 R1 時期大幅增長,DeepSeek 啟動了成立以來的首次外部融資,計畫募集 3 億美元資金以支持後續研發。
在商業營運上,DeepSeek 透過股權調整強化了創始人的控制權,梁文鋒直接持股比例增至 34%。同時,該公司將 V4 的 API 價格定為每百萬 token 0.3 美元。市場分析指出,此定價策略顯著壓縮了同業在商業市場的議價空間,並推動了行業結構性成本的下降。
梁文鋒在 DeepSeek-V4 發布時引用《荀子》:「不誘於譽,不恐於誹,率道而行」。他證明了中國 AI 不必一味跟在輝達後面跑,也能靠自己的算力基座站起來。DeepSeek-V4 的意義不在於榜單上的第幾名,而在於它讓中國 AI 產業在面臨斷供風險時,擁有了第二條可行的生命線。
