重大技術突破!傳OpenAI提升技術助推理成本砍半 GPU用量驟降至數百顆
鉅亨網編譯陳韋廷
AI 領域再傳震撼彈!外媒引述知情人士消息報導,OpenAI 本月稍早內部展示一項重大技術突破,透過全新研發的優化方案,成功將模型推理成本削減超過一半,大幅提升算力使用效率。

據悉,OpenAI 工程師向內部同仁展示,當將新技術應用於處理 ChatGPT 免費與付費帳號外的訪客請求時,所需的輝達高階 GPU 數量竟驟降至僅「數百顆」水準,與先前動輒需要數萬顆頂級晶片的規模相比,堪稱奇蹟。
目前,OpenAI 如何實現此效率躍進的具體細節尚不明朗,但根據業界推測,常用的優化手段可能包括:透過「量化壓縮」降低運算精度、「鍵值快取 (KV Cache)」減少重複計算、「批次處理」合併多筆查詢,或將簡單請求分流至功耗較低的輕量化模型。
這項突破對長期飽受高昂算力成本困擾的生成式 AI 產業而言,無疑是一劑強心針。
若能有效降低對昂貴 GPU 的依賴,不僅能大幅改善 OpenAI 的財務結構,更有望加速 AI 技術在更廣泛場景的普及與落地。
延伸閱讀
- 美光利多將盡?高盛揭記憶體供應鏈「三大」隱憂
- 不只賣晶片!輝達入股澳洲AI基建商 17萬顆GPU進駐印尼建資料中心
- AI競賽變政治競賽!OpenAI超強GPT-5.6發布背後的「審查風暴」
- 輝達再擴張AI版圖!資料中心乙太網路交換器收入暴增193%、悄悄登頂全球第一
- 講座
- 公告
上一篇
下一篇