台股

北美CSP掃貨輝達GB/Rubin機櫃 今年AI推論算力躍升1.2倍

鉅亨網記者魏志豪 台北

研調機構 TrendForce 今 (20) 日公布最新 AI 產業研究,北美五大雲端服務供應商 (CSP) 為擴大 AI 訓練和推論應用部署,2026 年對整櫃式 (rack-scale)AI 伺服器的採購意願明顯提高,不僅有望占據全球 60% 以上的輝達 (NVDA-US) GB/VR 需求量,更將同步帶動五大業者 AI 總訓練算力年增逾 56%、AI 總推論算力年成長高達 122%。

cover image of news article
伺服器示意圖。(圖:REUTERS/TPG)

TrendForce 預估,2026 年 AI 伺服器出貨將年增 28% 以上,仍以高階 AI 訓練機種為主力,占比約 55%。然中長期內將改由 AI 推論機種主導,主因是 CSP 將積極推展 AI 應用以加速實現 AI 雲端服務商用化,輝達也將拓展更多 AI 推論方案或使用情境,包括推動今年主力 AI 伺服器方案 GB/VR 系統,也特別強調該方案除 AI 訓練用途外,也可支援 AI 推論相關工作負載。


據 TrendForce 估計,2026 年 Google、Amazon、Microsoft、Meta、Oracle 的合計資本支出將逾 7,700 億美元,年增近 87%。分析北美五大 CSP 購置輝達 GB/VR 系列獲得的運算能力,針對 AI 訓練部分,若以 FP16/BF16 為估算基礎,2025 年五大業者的總算力達逾 9 ExaFLOPS,2026 年另將成長 56% 以上。

針對 AI 推論,若以 FP4/NVFP4 運算效能為估算基礎,2025 年五大 CSP 的總算力逾 37 ExaFLOPS,預計 2026 年將大幅成長近 122%,顯著高於 AI 訓練,反映出 NVIDIA 此次軟硬體系統調校特別著重 AI 推論效能,並落實在新一代的 GB300、VR200 整櫃式方案中。

除 GPU 方案外,CSP 業者同步推進自研 ASIC 整櫃產品,以 Google 布局最積極。TrendForce 預估,2026 年 Google 對自家 TPU 晶片需求量將年增近 80%,並於下半年後將從 v7 逐漸升級至 v8 世代。Amazon 自研 ASIC 的力道僅次於 Google,預計 2026 年其 Trainium 系列於自家 AI 伺服器占比將達 40% 以上。

TrendForce 表示,NVIDIA、AMD 和 CSP 自研 ASIC 的新世代機櫃皆整合液冷散熱系統,有助降低 AI 伺服器的 U 數,提高單一機櫃可容納的加速器數量。在單顆 AI GPU 或 ASIC 的熱設計功耗 (TDP) 同步提高的情況下,AI 伺服器系統功耗呈結構性放大。

據 TrendForce 估算,2023 年北美五大 CSP 的 server 功耗合計年增 2.8GW,至 2026 年躍升至 18GW,2025 至 2026 年的年成長率高達 116%,主因即 AI 競賽白熱化,NVIDIA GB300、AMD Helios 和 CSP 自研 ASIC 平台將同步放量。


section icon

鉅亨講座

看更多
  • 講座
  • 公告

    Empty
    Empty