低成本高效AI再突破!史上最快語言模型誕生 比OpenAI快4倍
鉅亨網新聞中心 2025-03-12 14:48

AI 新創公司發表 Inception Labs 全球首個商用級擴散大語言模型 Mercury Coder,比當前的 LLM 速度更快 5 至 10 倍,並且以低成本提供高品質。
現有的大語言模型(LLM)都採用自回歸方式工作,就像人類閱讀一樣,從左到右一個詞一個詞地生成文本。這種順序性意味著必須先生成前面的所有內容,才能產生後續內容。
而擴散模型正是革命性突破。這類模型採用「從粗到細」的生成過程,透過幾個「去噪」步驟,將輸出從純噪音逐步精煉成高品質內容。
與傳統模型不同,擴散模型不局限於只考慮前面的輸出,它能夠更好地進行推理並建構回應結構。更重要的是,擴散模型可以不斷完善其輸出,修正錯誤和幻覺。
這就是擴散技術已經成為 Sora、Midjourney 和 Riffusion 等視訊、影像和音訊生成領域核心動力的原因。
Mercury Coder 作為首個公開可用的擴散大語言模型(dLLM),為 AI 能力設立了全新標準:它比當前一代 LLM 快 5-10 倍。其中,在標準編碼基準測試中表現出色,經常超越 GPT-4o Mini 和 Claude 3.5 Haiku 等速度優化的自回歸模型,同時速度快至 10 倍。
擴散大語言模式的獨特之處在於其速度。即使是優化過的自回歸模型最多也只能達到每秒 200 個詞元,而 Mercury Coder 在普通的輝達 H100 上可以達到每秒超過 1000 個詞元,提速 5 倍。
更令人興奮的是,開發者在 Copilot Arena 基準測試中更喜歡 Mercury 的程式碼補全。 Mercury Coder Mini 並列第二,超越了 GPT-4o Mini 和 Gemini-1.5-Flash 等速度最佳化模型,甚至超過了 GPT-4o 等更大的模型。同時,它也是最快的模型,比 GPT-4o Mini 快約 4 倍。
- 掌握全球財經資訊點我下載APP
延伸閱讀
上一篇
下一篇