menu-icon
anue logo
熱門時事鉅亨號鉅亨買幣
search icon
美股

客製化晶片崛起 輝達未來充滿變數

鉅亨網新聞中心 2024-08-03 11:42

cover image of news article
輝達的崛起之路或再生變數(圖:Shutterstock)

今年底即將發佈的 ChatGPT 5.0,市場對此寄予厚望的同時,OpenAI 也一直在推進客製化晶片 ASIC 的相關計劃,正在與博通、美滿等全球晶片設計巨頭洽談開發客製化晶片。隨全球 AI 演算法發展進入現階段,基於 Transformer 架構及其演算法變種的認可度正在加速成為主流,底層計算中以張量運算為主的演算法確定性逐漸增強,進而推高了產業面向張量運算 ASIC 體系發展的價值量。新財富產業研究院認為,全球 AI 發展的下半場,隨著 AI 演算法及其架構現階段趨於穩定,客製化 ASIC 預測將重新焕發生機,輝達未來的產業發展將充滿變數。

全球晶片品類從計算時代的 CPU 橫掃資料中心與個人電腦等全產品線,再到現如今算力時代 GPU 的崛起,產業資本支出對算力晶片持續保持高位運行,客戶需求與產品線的完美共振造就了輝達及美股自去年以來的一路高歌猛進。與此同時,大模型算力需求至今持續井噴,今年也未見放緩跡象。近期輝達在算力晶片方面對台積電繼續增加高達 25% 的投片量,台積電下半年業績或繼續超預期。Scaling law 告訴我們要不停地堆算力和資料,資料中心的算力規模如今成為了大模型迭代速度的最關鍵因素。在 Transformer 架構及堆料張量運算乘法核所構建的現階段高確定性行業發展設計思路支持下,促使定客製化 ASIC 重出江湖。

現階段全球算力客製晶片 ASIC 方面,以博通和美滿的市占率為主。博通以 35% 的市占率位居第一,其次是美滿以 12% 的市占率位居第二。據研究公司 650 Group 估計,資料中心客製化晶片市場今年將增長至 100 億美元,到 2025 年將翻一番。博通如今的營收增速很大一部分來自於客製晶片 ASIC 業務,這也使博通在 2023 年的下行周期中成為少數幾家實現營收增長的公司之一。

在差不多 20 年前,晶片發展史上就出現過定制晶片 ASIC 取代通用晶片 GPU 的過程。早年行業算力較低,並行計算較弱的 CPU 曾經參與早期的比特幣挖礦,並成為當時主要的算力來源。2010 年起,隨著比特幣持續走高,挖礦算力需求快速提升,同時由於比特幣採用 SHA256 哈希演算法適合並行計算,因此在 2010 年至 2012 年期間,GPU 算力逐漸取代 CPU,成為當時主要的算力來源。

2012 年後期,比特幣持續全球暴漲,挖礦算力需求進一步增長,高性價比客製晶片 ASIC 開始出現在市場上。我們認為哈希演算法的確定性以及行業對下游算力需求的樂觀預期,共同造就了挖礦行業 ASIC 晶片快速取代通用晶片 GPU 的歷史進程,自此全球挖礦算力需求絕大部分市場皆由定制晶片 ASIC 所佔領。

輝達也完全意識到自身主營業務的潛在風險,因此成立了新的業務部門,專注於為雲運算公司設計定制算力晶片,客戶群涵蓋輝達現階段的主要收入來源,包括谷歌、微軟、亞馬遜、Meta 等,旨在搶佔客製晶片未來爆炸性的市場需求,以此提前布局免受尋求輝達晶片替代品的潛在風險影響。產品普遍性方面,針對固定架構及演算法所設計的場景需求定制晶片,其在特定應用方面性能明顯優於通用晶片 GPU,因此在特定演算法場景下,擁有最佳性能的客製晶片比輝達的通用 GPU 更具優勢。

同時,我們發現今年起 AI 處理的重心正從雲端算力轉向邊緣端側場景應用,預測客製化晶片的高性價比優勢在全球應用推理階段將進一步放大,市場規模相較全球 AI 發展初期的算力訓練階段將顯著提升,競爭格局整體走向利好全球頭部數家 AI 晶片設計廠商。因此,輝達現階段所面臨的市場局勢不容樂觀。

輝達主要優勢在於,軟體 CUDA 生態長期以來所培養的全球 AI 開發者習以為常的設計流程慣性與 Omniverse 等軟體開發配套的完備性,以及 GPU 互聯技術全球領先的 NVLink 解決方案。這些優勢為輝達在大模型算力訓練階段構築了極深的產業護城河。例如,HGX H100 8-GPU 使用高速 NVIDIA NVLink 4.0 技術、NVSwitch 互連,以及 NVIDIA Quantum-2 InfiniBand 與 Spectrum-4 乙太網,大幅突破 AI 集群互聯的極限。該伺服器內部包含 NVLink、PCIe 和 QPI 等主板總線,GPU 之間的互聯通過 NVSwitch 晶片來實現,CPU 與 GPU 之間的互聯則通過 PCIe 5.0 總線實現。無論是單晶片算力還是 AI 集群互聯算力方面,輝達現階段皆實現了全球領先。

此外,在晶片議價方面,輝達在晶圓的採購量現階段遠超博通和美滿,進而擁有較高的議價能力和規模量產的優先權。按此邏輯,即使超級雲運算廠商擁有強大的 IC 設計團隊,除非能與台積電簽訂具價格競爭力的長期協議訂單,否則難以在價格上取得優勢,打破輝達現階段的壟斷局面。

從挖礦時代客製晶片 ASIC 的崛起,進而取代通用晶片 GPU 成為挖礦主力,再到如今 AI 算力晶片 ASIC 的重新登場,歷史似乎正在重演。總體來看,我們認為客製晶片 ASIC 的出現往往是因為某一類重要的特定演算法推動了下游晶片需求的大爆發,進而使過往通用型晶片中的特定功能被分割出來,形成了新的客製化晶片。現階段在 Transformer 架構下的張量堆料矩陣運算趨於穩定,基於此穩定且特定演算法需求的出現,通用晶片中的小核心甚至是向量計算核心,逐漸成為了功耗與成本的負擔。客戶終究不會因為此單一特定的張量運算需求而負擔通用晶片中的額外硬體成本,因此客製化片 ASIC 的崛起是歷史的必然。

今年起,預測客製晶片 ASIC 產品發展路線的重點將主要集中在三大方向,通用晶片與 ASIC 晶片將相輔相成、互相促進。現階段產業前期由通用晶片探索新演算法、搭建大模型,後期由 ASIC 晶片通過高性價比將下游需求大規模釋放,特別是在接下來全球應用推理階段,其價值量預測將進一步放大。整體發展方向包括:

  • 效仿 Google 客製晶片 TPU 擴大晶片面積,即在單個晶片內設計更多張量運算核心,進而提升定制晶片的算力。
  • 效仿客製晶片 Groq 設計的 sRAM、DDR 高速存儲橋接產品路線,即張量運算核心將數據運算後直接轉移給相鄰的 sRAM 或 DDR,進而實現多運算核心之間的更高效協作方案,其性價比勝過 HBM 方案。
  • 控制算核運算的編譯器相較以往更加重要。由於 ASIC 晶片架構中缺少了如通用晶片中對數據預處理的小核心,AI 晶片設計廠商需重塑編譯器軟體設計環節。

文章標籤