menu-icon
anue logo
鉅亨傳承學院鉅亨號鉅亨買幣
search icon

美股

WSJ:輝達計劃推新AI晶片 推論晶片戰略大升級

鉅亨網編譯羅昀玫

《華爾街日報》週五 (27 日) 報導,AI 晶片龍頭輝達計劃推出一款專為 AI 推論運算設計的新處理器,目標協助 OpenAI 等客戶打造更快速、更高效率的工具,外界認為此舉可能重塑 AI 運算市場版圖,將於下月在聖荷西舉行的 GTC 開發者大會亮相。

cover image of news article
輝達計劃推新AI晶片 有望改寫運算版圖 (圖:shutterstock)

輝達 (NVDA-US) 正醞釀新一輪產品布局。知情人士透露,輝達正在開發一套全新的推論運算系統,所謂推論是指讓 AI 模型即時回應使用者查詢的運算流程。


新平台預計將於下月在聖荷西舉行的 GTC 開發者大會亮相,並可能整合新創 Groq 設計的晶片技術。

隨著 AI 應用從模型訓練逐步轉向實際部署與即時回應,推論運算已成為產業競爭焦點。Google 與 Amazon 近年均推出自研晶片與輝達旗艦產品競爭,加上自動化程式開發快速興起,也推升市場對高效率推論晶片的需求。

消息指出,OpenAI 已同意成為新處理器的重要客戶之一。作為輝達長期大客戶,OpenAI 近月積極尋找更具效率的替代方案,上月更與其他晶片新創簽署合作,顯示其在算力供應上的策略更趨多元。

OpenAI 週五稍早宣布,將向輝達採購大規模「專用推論算力」,同時也與亞馬遜 (AMZN-US) 簽署協議採用 Trainium 晶片,反映大型 AI 業者正同步分散供應來源。

長期以來,輝達憑藉 GPU 在 AI 訓練領域建立近九成市占的主導地位,其 Hopper、Blackwell 與 Rubin 系列仍被視為業界標竿。不過,隨著企業加速部署 AI 代理 (Agentic AI) ,市場需求正由訓練轉向推論,部分客戶認為 GPU 成本與耗能偏高,未必最適合大規模實際運行。

在此趨勢下,市場對更低成本、更節能的推論晶片需求明顯升溫。OpenAI 上月即與 Cerebras 簽署數十億美元合作案,該公司主打其推論晶片速度優於傳統 GPU,顯示輝達正面臨新一波競爭壓力。

報導也指出,輝達去年底同意斥資約 200 億美元取得 Groq 關鍵技術授權並延攬其核心團隊,包括創辦人 Jonathan Ross。Groq 採用不同於 GPU 的語言處理單元(LPU)架構,在推論任務上具備高效率優勢,外界關注輝達後續整合策略。

此外,輝達近期亦展現更彈性的產品思維。本月公司宣布擴大與 Meta Platforms (META-US) 合作,首次出現大規模僅採用 CPU 的部署,用於支援 Meta 廣告 AI 代理,被視為輝達試圖突破 GPU 框架、全面卡位 AI 運算市場的重要訊號。


section icon

鉅亨講座

看更多
  • 講座
  • 公告

    Empty
    Empty