menu-icon
anue logo
熱門時事鉅亨號鉅亨買幣
search icon

雜誌

deepseek改寫AI版圖

先探投資週刊 2025-02-06 12:46


雖然全球最頂級的 AI 晶片仍由 Nvidia 全面主宰,這次深度求索重擊美股,加上最近 Nvidia 股價弱勢,鼓舞開發商未來可能不需要砸大錢買高階 AI 晶片就能做出適合自己用的 AI 模型,會激勵 AI ASIC 晶片產業蓬勃發展。


【文/魏聖峰】

美國總統川普剛就任的隔天,馬上召集軟銀、甲骨文和 OpenAI 高層,將耗資五千萬美元在美國成立類似主權AI的相關投資計畫。不料,隔天原本沒有名氣的中國深度求索(DeepSeek)發表一款AI模型R1,之後引發華爾街市場大震撼,且被市場稱為「AI珍珠港事件」,襲擊美國AI相關股,並讓美股在一月二十七日當天市值蒸發掉一兆美元,與AI關聯度最高的費城半導體指數當天重挫後,因 Nvidia 表現不佳至今走勢相對弱勢,等於是給川普洗臉。

美國與中國關係惡化,從八年前川普在第一任總統期間宣布向中國發動貿易戰。拜登繼任總統後,除貿易戰外還擴大封鎖中國科技。對中國的科技封鎖不限美國企業,還把美國所有的盟友拉進來,持續要求外資企業撤離中國並選邊站。在這樣敵我界線分明下,中國透過各種管道還是有能力拿到 Nvidia 的高階AI晶片。深度求索承認使用約兩千多片的 H200 晶片,且整個開發成本僅約五六○萬美元就打造出能與 OpenAI、谷歌同等級的AI模型 DeepSeek-R1。

這樣的AI模型成本結構與美國大型CSP業者至少要使用一.六萬片的 H200 和 H100 晶片相比,其開發成本僅是 OpenAI 成本的二%。在 DeepSeek-R1 大出鋒頭後,引發全球用戶大量下載,不到一個星期,累積的下載次數超過一六○○萬次,尤其以印度用戶的下載數量最高。

華爾街質疑開發成本過低

衝擊過後,華爾街引述數名半導體分析師對深度求索能以如此低成本,打造出能與美國先進AI模型相匹敵產品提出質疑,大部分分析師普遍認為深度求索不太可能以這麼低的成本打造出具突破性的AI模型,要不然那些美國大型CSP業者過去不就白花錢。OpenAI 創辦人阿特曼(Sam Altman)也跳出來質疑,深度求索有不合法使用 OpenAI 模型的技術,而他們也掌握相關的證據。部分晶片分析師認為,深度求索應該用到五萬片的AI晶片才做得出來,而五六○萬的開發成本也僅能算是應用上的使用成本。因為五萬片AI晶片的成本就不只這些金額,也有分析師質疑應該有中國政府介入,才有辦法做得出來。

Meta 目前正在研發的 Research SuperCluster(RSC)至少就使用超過一.六萬片的 A100 晶片,該公司目前的 Llama 大型語言模型、谷歌 Gemini 和 OpenAI 的AI模型也都耗掉上萬片的AI晶片才做得出來。特斯拉創辦人馬斯克的 xAI 早已購入超過十萬片的 H200 和 H100 晶片,只要 Nvidia 的 GB200 晶片出得了貨,也都會被特斯拉、甲骨文和大型CSP業者掃貨。市場擔心如果深度求索能以極低的成本打造出AI模型,就會引來AI產業反思是否真的有必要砸大錢打造AI模型,甚至引發AI產業是否將泡沫化的問題。

遭美國封鎖下生出的產品

以時間推論,不論是深度求索在去年十二月下旬推出的 DeepSeek-V3 還是這次令市場震撼的 DeepSeek-R1 AI 模型,在開發期間都處於被美國政府科技封鎖期間。雖然 Nvidia 推出閹割版的 H20 晶片,只有 H200 本尊效能的十分之一,他們還是能開發出頂尖的AI模型出來。先進的AI系統需歸納文字、圖片、影音等大數據的深度學習技能,深度求索大概是把這些數據分析工作分配給多個不同模型,每個模型負責特定領域,力求讓高效數據處理的時間縮短。這種方式在美國和其他發展AI模型的國家並非沒做過,只不過是沒辦法像深度求索那樣僅用到更少的運算能力就做到這樣的地步。(全文未完)

來源:《先探投資週刊》2338 期
更多精彩內容請至 《先探投資週刊


Empty