科技

低成本高效AI再突破！史上最快語言模型誕生比OpenAI快4倍

鉅亨網新聞中心2025-03-12 14:48

AI 新創公司發表 Inception Labs 全球首個商用級擴散大語言模型 Mercury Coder，比當前的 LLM 速度更快 5 至 10 倍，並且以低成本提供高品質。

cover image of news article — 低成本高效AI再突破！史上最快語言模型誕生比OpenAI快4倍。(圖:shutterstock)

現有的大語言模型（LLM）都採用自回歸方式工作，就像人類閱讀一樣，從左到右一個詞一個詞地生成文本。這種順序性意味著必須先生成前面的所有內容，才能產生後續內容。

‌

而擴散模型正是革命性突破。這類模型採用「從粗到細」的生成過程，透過幾個「去噪」步驟，將輸出從純噪音逐步精煉成高品質內容。

與傳統模型不同，擴散模型不局限於只考慮前面的輸出，它能夠更好地進行推理並建構回應結構。更重要的是，擴散模型可以不斷完善其輸出，修正錯誤和幻覺。

這就是擴散技術已經成為 Sora、Midjourney 和 Riffusion 等視訊、影像和音訊生成領域核心動力的原因。

Mercury Coder 作為首個公開可用的擴散大語言模型（dLLM），為 AI 能力設立了全新標準：它比當前一代 LLM 快 5-10 倍。其中，在標準編碼基準測試中表現出色，經常超越 GPT-4o Mini 和 Claude 3.5 Haiku 等速度優化的自回歸模型，同時速度快至 10 倍。

擴散大語言模式的獨特之處在於其速度。即使是優化過的自回歸模型最多也只能達到每秒 200 個詞元，而 Mercury Coder 在普通的輝達 H100 上可以達到每秒超過 1000 個詞元，提速 5 倍。

更令人興奮的是，開發者在 Copilot Arena 基準測試中更喜歡 Mercury 的程式碼補全。 Mercury Coder Mini 並列第二，超越了 GPT-4o Mini 和 Gemini-1.5-Flash 等速度最佳化模型，甚至超過了 GPT-4o 等更大的模型。同時，它也是最快的模型，比 GPT-4o Mini 快約 4 倍。