開源王座一夜易主!Meta發布新Llama 4模型 擊敗DeepSeek V3
鉅亨網新聞中心 2025-04-07 11:07

開源王座一夜易主!Meta(META-US) 發布了其最新的開源大型語言模型 Llama 4,首次採用 MoE 混合專家架構,支援多達 12 種語言。
新系列具備業界領先的長文本處理能力與圖文整合效能,開放權重模型即日起可於 llama.com 與 Hugging Face 平台下載,並已整合至 WhatsApp、Messenger 與 Instagram Direct 等 Meta 旗下產品。
Llama 4 首批釋出的兩個版本分別為 Llama 4 Scout 和 Llama 4 Maverick,它們在參數規模、活躍參數數量和上下文長度上有所不同。
根據官網介紹,Llama 4cout 為一款具備 170 億活躍參數、由 16 位專家組成的多模態模型,支援高達 1,000 萬 token 的上下文長度,適用於長文件總結、多檔案分析與大型程式碼庫推理。其 iRoPE 架構大幅提升長文本的泛化能力。
Llama 4 Maverick 則是另一款 170 億活躍參數、由 128 位專家組成的模型,在同類型多模態模型中表現最佳,超越 GPT-4o 與 Gemini 2.0 Flash,在多項基準測試中名列前茅。
值得一提的是,其推理與程式編寫能力與新推出的 DeepSeek v3 不相上下,但所使用的活躍參數不到後者的一半。Llama 4 Maverick 兼具頂尖效能與極高的成本效益,其實驗性聊天版本在 LMArena 平台測得 ELO 分數為 1417,展現強大綜合實力。
此次 Llama 4 系列全面採用 Mixture of Experts(MoE)架構,每次推論僅啟用部分參數,顯著提升訓練與運算效率。例如 Llama 4 Maverick 雖擁有 4,000 億總參數,卻能於單一 NVIDIA H100 主機上部署,降低運算資源。
Meta 重申對開源社群的承諾,強調 Llama 4 內建多層次防護與審查機制,包括 Llama Guard、Prompt Guard 與 CyberSecEval 等工具,協助開發者偵測不當輸入與輸出,降低模型濫用風險。針對模型偏見問題,Meta 指出 Llama 4 相較於 Llama 3.3,在爭議性議題上的拒答率已由 7% 降至 2% 以下,回應也更具平衡性,展現打造能同理多元觀點 AI 系統的努力。
Llama 4 的橫空出世,成為迄今為止開源最強,多模態能力最好的模型之一。在大模型 LMSYS 排行榜上,Llama 4 Maverick 衝上第二名( ELO 得分 1417),僅次於閉源 Gemini 2.5 Pro。
Meta 預告,將於 4 月 29 日舉辦 LlamaCon,揭示 Llama 4 Behemoth 完整細節,並公布 Llama 生態系未來布局,強調 Llama 4 系列是推動次世代人機互動的重要基石,未來將持續拓展產品整合與開發者應用場景,打造更智慧、更具人性化的 AI 體驗。
- 2025掌握債券投資契機主動 + 靈活
- 掌握全球財經資訊點我下載APP
延伸閱讀
上一篇
下一篇