美股

開源王座一夜易主！Meta發布新Llama 4模型擊敗DeepSeek V3

鉅亨網新聞中心2025-04-07 11:07

開源王座一夜易主！Meta(META-US) 發布了其最新的開源大型語言模型 Llama 4，首次採用 MoE 混合專家架構，支援多達 12 種語言。

新系列具備業界領先的長文本處理能力與圖文整合效能，開放權重模型即日起可於 llama.com 與 Hugging Face 平台下載，並已整合至 WhatsApp、Messenger 與 Instagram Direct 等 Meta 旗下產品。

‌

Llama 4 首批釋出的兩個版本分別為 Llama 4 Scout 和 Llama 4 Maverick，它們在參數規模、活躍參數數量和上下文長度上有所不同。

根據官網介紹，Llama 4cout 為一款具備 170 億活躍參數、由 16 位專家組成的多模態模型，支援高達 1,000 萬 token 的上下文長度，適用於長文件總結、多檔案分析與大型程式碼庫推理。其 iRoPE 架構大幅提升長文本的泛化能力。

Llama 4 Maverick 則是另一款 170 億活躍參數、由 128 位專家組成的模型，在同類型多模態模型中表現最佳，超越 GPT-4o 與 Gemini 2.0 Flash，在多項基準測試中名列前茅。

值得一提的是，其推理與程式編寫能力與新推出的 DeepSeek v3 不相上下，但所使用的活躍參數不到後者的一半。Llama 4 Maverick 兼具頂尖效能與極高的成本效益，其實驗性聊天版本在 LMArena 平台測得 ELO 分數為 1417，展現強大綜合實力。

此次 Llama 4 系列全面採用 Mixture of Experts（MoE）架構，每次推論僅啟用部分參數，顯著提升訓練與運算效率。例如 Llama 4 Maverick 雖擁有 4,000 億總參數，卻能於單一 NVIDIA H100 主機上部署，降低運算資源。

Meta 重申對開源社群的承諾，強調 Llama 4 內建多層次防護與審查機制，包括 Llama Guard、Prompt Guard 與 CyberSecEval 等工具，協助開發者偵測不當輸入與輸出，降低模型濫用風險。針對模型偏見問題，Meta 指出 Llama 4 相較於 Llama 3.3，在爭議性議題上的拒答率已由 7% 降至 2% 以下，回應也更具平衡性，展現打造能同理多元觀點 AI 系統的努力。

Llama 4 的橫空出世，成為迄今為止開源最強，多模態能力最好的模型之一。在大模型 LMSYS 排行榜上，Llama 4 Maverick 衝上第二名（ ELO 得分 1417），僅次於閉源 Gemini 2.5 Pro。

Meta 預告，將於 4 月 29 日舉辦 LlamaCon，揭示 Llama 4 Behemoth 完整細節，並公布 Llama 生態系未來布局，強調 Llama 4 系列是推動次世代人機互動的重要基石，未來將持續拓展產品整合與開發者應用場景，打造更智慧、更具人性化的 AI 體驗。