A股港股

DeepSeek V4 如何以「淪為二流」的風險換取中國 AI 算力主權？

鉅亨網新聞中心2026-05-04 17:10

DeepSeek 於 2026 年 4 月下旬發布旗艦級開源模型 DeepSeek-V4，其參數規模達 1.6 兆。該模型包含 V4-Pro 與 V4-Flash 兩個版本，原生支援百萬 token 超長上下文。在性能定位上，技術報告顯示 V4-Pro 的基準測試表現優於 GPT-5.2 與 Gemini-3.0-Pro，但與全球頂尖模型 GPT-5.4 相比，仍存在約 3 至 6 個月的技術差距。

cover image of news article — DeepSeek V4 如何以「淪為二流」的風險換取中國 AI 算力主權？(圖:shutterstock)

這款模型的登場不僅是性能的展示，更是創始人梁文鋒對中國 AI 產業鏈的一場壯烈「探路」。據陸媒報導，在模型性能追求「第一梯隊」的商業常規下，梁文鋒選擇了一條反商業直覺的道路：冒著排名下滑與淪為二流的風險，為國產算力趟出一條生路。

‌

這場探路的代價是極其沈重的。為了這次轉向，DeepSeek 面臨了三大危機：首先是人才流失，核心成員如羅福莉、郭達雅等相繼被小米、字節、騰訊挖走；其次是市場蠶食，字節的「豆包」與月之暗面的「Kimi」趁虛而入搶占日活；最後是原則妥協，梁文鋒被迫打破「不融資」鐵律，啟動超 100 億美元估值的融資以支撐昂貴的國產算力研發成本。

技術遷移與研發策略

在研發過程中，DeepSeek 創始人梁文鋒採取了側重技術適配的戰略選擇。為了解決大模型從 NVIDIA 的 CUDA 生態遷移至國產算力平台的兼容性問題，研發團隊耗時約 5 個月，重寫了 40 萬行算子。此舉實現了兆級參數模型在華為昇騰（Ascend）CANN 架構上的全棧跑通。

數據顯示，經深度優化後，V4 在昇騰晶片上的推理速度較初期版本提升了 35 倍，且與 CUDA 代碼的兼容性達到 95%。

產業鏈連動效應

此項技術路徑的確立對中國 AI 產業鏈產生了影響。在 V4 發布當日，包含寒武紀、海光、摩爾線程在內的 8 家國產 AI 晶片廠商相繼宣布完成適配。市場動態顯示，阿里、字節跳動與騰訊等企業已累計向華為訂購數十萬顆昇騰 950PR 晶片，顯示技術堆棧正加速轉向自主化。

中國信通院亦隨之啟動 DeepSeek-V4 國產化適配測試，評測範圍覆蓋晶片、伺服器及開發工具鏈等全棧產品。

商業與競爭成本

然而，側重底層適配的研發模式也伴隨相關成本。由於更新頻率在一段時間內相對放緩，DeepSeek 面臨部分核心技術人才流失至小米、字節跳動及騰訊等企業的挑戰。市場數據指出，在競爭產品如「豆包」與「Kimi」的壓力下，DeepSeek 的用戶增長曲線已趨於平緩。

此外，由於 V4 的單輪訓練成本飆升至約 5 億美元，較 R1 時期大幅增長，DeepSeek 啟動了成立以來的首次外部融資，計畫募集 3 億美元資金以支持後續研發。

定價與市場結構

在商業營運上，DeepSeek 透過股權調整強化了創始人的控制權，梁文鋒直接持股比例增至 34%。同時，該公司將 V4 的 API 價格定為每百萬 token 0.3 美元。市場分析指出，此定價策略顯著壓縮了同業在商業市場的議價空間，並推動了行業結構性成本的下降。

梁文鋒在 DeepSeek-V4 發布時引用《荀子》：「不誘於譽，不恐於誹，率道而行」。他證明了中國 AI 不必一味跟在輝達後面跑，也能靠自己的算力基座站起來。DeepSeek-V4 的意義不在於榜單上的第幾名，而在於它讓中國 AI 產業在面臨斷供風險時，擁有了第二條可行的生命線。

‌

文章標籤

梁文鋒 deepseek V4 華為昇騰騰訊字節跳動 AI算力

延伸閱讀

鉅亨講座

看更多

講座
公告

下一篇
中國車企追尋「Yaris 時刻」藉由在地化設計開拓全球版圖