menu-icon
anue logo
鉅亨傳承學院鉅亨號鉅亨買幣
search icon

美股

扶植本土供應鏈!DeepSeek遭爆拒向美晶片商公開V4模型 旨在削弱美硬體優勢

鉅亨網編譯余曉惠

中國人工智慧 (AI) 實驗室 DeepSeek 去年以低成本模型震撼全球市場,目前正準備在農曆新年後發布重大更新版本 V4,但消息人士向路透披露,DeepSeek 並未按慣例把新一代模型提供給美國晶片製造商進行效能優化,而是選擇向華為在內的中國本土供應商提供提前存取權限,打破了重大模型更新前的標準產業作法。

cover image of news article
DeepSeek遭爆拒向輝達等美晶片商提供最新AI模型 專家指目的在扶持本土供應鏈 (圖:Shutterstock)

一般來說,AI 開發商在發表重大模型前,會與輝達 (NVDA-US) 及超微 (AMD-US) 等主要晶片製造商分享預發布版本,以確保軟體能在廣泛使用的硬體上高效運行。


未向輝達、超微提供權限

DeepSeek 過去也曾與輝達的技術團隊密切合作,但消息人士表示,DeepSeek 的新模型預定農曆新年前後發表,但目前仍未向輝達與超微提供存取權,而是讓包括華為在內的中國晶片製造商,提前數周進行軟體優化。

輝達與超微拒絕評論此事,DeepSeek 與華為未回應置評請求。

研究機構 Creative Strategies 執行長 Ben Bajarin 說:「DeepSeek 對輝達與超微的通用數據加速器造成的影響微乎其微。大多數企業並未運用 DeepSeek,比較像是當成某種基準測試的模型。」隨著新的 AI 編碼工具出現,軟體與硬體磨合的時間已從幾個月縮短為幾周。

專家推測為中國政府戰略

不過 Bajarin 進一步指出,此舉可能是中國政府更廣泛戰略的一環,「目的在讓美國硬體與模型在中國處於劣勢」。

此傳言曝光之際,日前才有一名川普政府高級官員表示,DeepSeek 最新 AI 模型是透過中國一個運算叢集使用輝達最先進的 Blackwell 晶片所訓練完成的,然而此做法似乎已違反美國出口管制規定。

這名美國官員表示,DeepSeek 可能試圖移除顯示曾使用美國 AI 晶片的痕跡,並計劃對外宣稱自家模型是用華為晶片訓練完成的。

DeepSeek 模型自 2025 年 1 月爆紅以來,在開源平台 Hugging Face 上的下載次數已超過 7500 萬次,並在中國掀起一波開源模型浪潮,與美國 AI 實驗室競爭。過去一年發布的模型中,中國模型在該平台的下載量已超越其他國家。

隨著中國開源模型迅速崛起,有關華府是否應向中國出口先進 AI 晶片的辯論也加劇。美國去年允許輝達 H20 及超微 MI308 晶片恢復出口中國,但對更先進處理器的出口許可仍有限制。目前尚不清楚,DeepSeek 是否已獲准採購相關美國晶片。

H20 與 MI308 晶片主要用於推論,也就是運行已訓練完成的 AI 模型。超微曾表示 MI308 需求強勁,最近一季創造 3.9 億美元銷售額。


section icon

鉅亨講座

看更多
  • 講座
  • 公告

    Empty
    Empty