北美CSP掃貨輝達GB/Rubin機櫃 今年AI推論算力躍升1.2倍
鉅亨網記者魏志豪 台北
研調機構 TrendForce 今 (20) 日公布最新 AI 產業研究,北美五大雲端服務供應商 (CSP) 為擴大 AI 訓練和推論應用部署,2026 年對整櫃式 (rack-scale)AI 伺服器的採購意願明顯提高,不僅有望占據全球 60% 以上的輝達 (NVDA-US) GB/VR 需求量,更將同步帶動五大業者 AI 總訓練算力年增逾 56%、AI 總推論算力年成長高達 122%。

TrendForce 預估,2026 年 AI 伺服器出貨將年增 28% 以上,仍以高階 AI 訓練機種為主力,占比約 55%。然中長期內將改由 AI 推論機種主導,主因是 CSP 將積極推展 AI 應用以加速實現 AI 雲端服務商用化,輝達也將拓展更多 AI 推論方案或使用情境,包括推動今年主力 AI 伺服器方案 GB/VR 系統,也特別強調該方案除 AI 訓練用途外,也可支援 AI 推論相關工作負載。
據 TrendForce 估計,2026 年 Google、Amazon、Microsoft、Meta、Oracle 的合計資本支出將逾 7,700 億美元,年增近 87%。分析北美五大 CSP 購置輝達 GB/VR 系列獲得的運算能力,針對 AI 訓練部分,若以 FP16/BF16 為估算基礎,2025 年五大業者的總算力達逾 9 ExaFLOPS,2026 年另將成長 56% 以上。
針對 AI 推論,若以 FP4/NVFP4 運算效能為估算基礎,2025 年五大 CSP 的總算力逾 37 ExaFLOPS,預計 2026 年將大幅成長近 122%,顯著高於 AI 訓練,反映出 NVIDIA 此次軟硬體系統調校特別著重 AI 推論效能,並落實在新一代的 GB300、VR200 整櫃式方案中。
除 GPU 方案外,CSP 業者同步推進自研 ASIC 整櫃產品,以 Google 布局最積極。TrendForce 預估,2026 年 Google 對自家 TPU 晶片需求量將年增近 80%,並於下半年後將從 v7 逐漸升級至 v8 世代。Amazon 自研 ASIC 的力道僅次於 Google,預計 2026 年其 Trainium 系列於自家 AI 伺服器占比將達 40% 以上。
TrendForce 表示,NVIDIA、AMD 和 CSP 自研 ASIC 的新世代機櫃皆整合液冷散熱系統,有助降低 AI 伺服器的 U 數,提高單一機櫃可容納的加速器數量。在單顆 AI GPU 或 ASIC 的熱設計功耗 (TDP) 同步提高的情況下,AI 伺服器系統功耗呈結構性放大。
據 TrendForce 估算,2023 年北美五大 CSP 的 server 功耗合計年增 2.8GW,至 2026 年躍升至 18GW,2025 至 2026 年的年成長率高達 116%,主因即 AI 競賽白熱化,NVIDIA GB300、AMD Helios 和 CSP 自研 ASIC 平台將同步放量。
延伸閱讀
- 3550億美元單日市值巨震將至?高盛看好輝達財報超預期 但市場更聚焦於「這件事」
- AI熱潮還沒完?分析師喊加碼輝達、蘋果等科技巨頭、減碼道瓊弱勢股
- 不只賣GPU!輝達AI版圖再擴張 Vera CPU正式交付四大客戶
- 輝達財報前夕「越跌越香」?華爾街喊目標價300美元起跳
- 講座
- 公告
上一篇
下一篇