鉅亨網編譯莊閔棻
人工智慧(AI)運算需求的擴張態勢持續升溫,且影響範圍正從晶片本身擴散至更廣泛的基礎設施領域。雲端服務商 CoreWeave(CRWV-US) 兩位高層近日接受媒體採訪指出,目前產業最大的限制已從晶片轉向資料中心的實體基礎建設,尤其是「供電機房」正在成為關鍵瓶頸。
CoreWeave 共同創辦人暨首席發展長 Brannin McBee,以及企業發展與投資者關係副總裁 Nick Robbins 指出,AI 需求至今未見任何放緩訊號。
相反,隨著 AI 代理(AI agent)浪潮加速推進,市場對 CPU、記憶體等周邊資源的需求正相對於 GPU 明顯攀升,促使資料中心的整體架構出現根本性調整。
針對目前限制 AI 基礎設施擴張的關鍵因素,McBee 明確指出真正的瓶頸在於「供電機房」(powered shell),也就是已經完成電力配置的資料中心建築主體本身,而不是 GPU 晶片或 HBM 記憶體等運算與儲存組件。
為了因應推理運算需求快速攀升,公司正調整整體架構設計,以支援新一代 AI 工作負載。至於 Vera Rubin 平台,預計將在 2027 年進入規模化擴張階段。
兩人將本輪需求加速的起點,回溯至去年第四季。McBee 表示,當時公司透過與客戶的深度工程合作,已提前察覺 AI 代理產品將在今年第一季密集問世的趨勢,而第一季也確實成為推理運算與 AI 消費的重要轉折點,且這股勢頭仍在延續。
McBee 特別提到,CoreWeave 是目前唯一同時服務 Anthropic、OpenAI、Meta(META-US) 、Google(GOOGL-US) 、微軟 (MSFT-US) 、輝達 (NVDA-US) 等頂尖 AI 機構的獨立雲端服務商,這樣的特殊定位讓公司得以提前掌握技術演進方向,並據此規劃基礎設施佈局。
AI 代理與推理模型的興起,正在改寫資料中心的硬體配置邏輯。McBee 指出,CoreWeave 自 2023 年起便已部署 CPU 資源,但近期趨勢顯示,CPU 與記憶體需求相對 GPU 的比重正明顯上升,且這個趨勢預期將持續下去。
Robbins 透露,公司去年已從根本重新設計資料中心的標準規格,預留更多空間給記憶體與 CPU 設備,未來將可看到大量輝達 Vera CPU 機架與 Vera Rubin GPU 伺服器並排部署的場景。
在 CPU 供應商方面,Robbins 表示目前機隊仍以超微半導體 (AMD-US) 產品為主,但隨著客戶需求演變,輝達 Vera CPU 可望成為早期重要選項,目前已吸引不少關注。
McBee 也補充說,CoreWeave 超過 98% 的營收來自合約客戶,基礎設施的建置方向,其實是由客戶的具體需求所定義。
被問及目前最大的擴張限制因素時,McBee 直接點出問題核心:並非 GPU 晶片或 HBM 記憶體,而是「供電機房」,其中電工人力短缺更是讓問題複雜化的因素之一。
他表示,CoreWeave 目前已有 49 個站點上線運營,累積了豐富的供應鏈應對經驗,清楚知道哪些供應商值得合作。
針對 HBM 記憶體成本上漲與短缺問題,Robbins 則說明公司的商業模式設計能有效隔絕價格波動風險:在簽署 GPU 採購訂單的同時,便鎖定向客戶收取的價格,藉此保護利潤率,成本上漲可順利轉嫁至客戶端。
他同時強調,零組件取得目前並非最大瓶頸,供電機房才是,但這個答案未來某個時間點也可能反轉。
談到輝達新一代 Vera Rubin 平台的量產時程,Robbins 給出較明確的預期。
他表示,CoreWeave 已是全球首家完成 Vera Rubin 機櫃上線並通過完整驗證的廠商,預計相關伺服器將於今年下半年陸續開始交付,但真正的大規模量產爬坡將貫穿整個 2027 年。
他將這個節奏類比於上一代 GB200/GB300 平台的發展路徑。GB 系列雖然在 2025 年就已問世,但真正進入大規模量產則是在 2026 年。
Robbins 預期 Vera Rubin 在未來 12 至 18 個月內,將呈現相當類似的發展模式。
面對 Azure、AWS、Google 等超大規模雲端業者,以及 SpaceX(SPCX-US) 、Nebius (YNDX-US) 、甲骨文 (ORCL-US) 等新興雲端服務商的競爭,CoreWeave 高層將自身差異化優勢歸結為三個面向:執行速度、效能表現與生態系深度。
McBee 援引第三方數據指出,全球前十大 AI 實驗室(不含中國)中有九家採用 CoreWeave 平台,研究機構 SemiAnalysis 也給予公司獨一無二的鉑金評級。
他認為,輝達優先分配 GPU 資源給 CoreWeave,正是出於對其工程執行能力的高度信任。
Robbins 則從客戶分層角度說明競爭策略:
下一篇
