科技

DeepSeek後最大驚喜！Manus成AGI里程碑？專家：難說但有望掀AI智能體時代高潮

鉅亨網編譯陳韋廷綜合報導2025-03-07 11:00

中國 AI 產品 Manus 一夜刷屏，這是全球首款真正意義上的通用 AI Agent，從官網展示的案例可以看到它能獨立思考、規劃並執行複雜任務，直接交付完整成果，官網案例包括旅行規劃、股票分析、課程準備、保險政策比較、供應商採購、財務報告分析、電商運營分析等多個領域。

根據 Monica.im 介紹，Manus 不僅僅是一個只會聊天的對話式 AI 工具，而是一個真正的自主智慧體 (Agent)。當其他 AI 可能只停留在生成想法的階段，而 Manus 能獨立思考並採取行動。官方將其視為人機協作的新範式，甚至可能是通向 AGI 的一個視窗。

‌

在一個演示案例中，結合家庭收入情況和孩子的上學要求讓 Manus 在紐約篩選一個安全、犯罪率低的社區，並購買符合標準的房子，而面對這類複雜任務，Manus 有條不紊地將其拆解為多個步驟，並創建詳細的待辦清單。搜索並閱讀關於紐約最安全社區的文章; 研究紐約的中學情況; 編寫 Python 程式來計算預算; 基於預算，在房地產網站上篩選合適的房源; 整合所有資訊，撰寫詳細報告並整理相關資料。

另一案例中，Manus 搖身一變成了專業股票分析師，讓 Manus 分析輝達、Marvell 及台積電過去 3 年股價之間相關性，Manus 可通過 API 訪問權威數據來源。在驗證數據後，Manus 開始編寫用於數據分析和可視化的代碼。

在完成數據分析和可視化後，Manus 也能基於這些數據創建一個網站。經使用者的授權後，還能將網站部署至線上，並提供一個可供分享的連結。

儘管 Manus 尚未全面開放，但其熱度已席捲全網。各大平台上，網友們紛紛深夜湧入評論區詢問邀請碼，火爆程度可見一斑。

Manus 的技術哲學為 less structure more intelligence，與主流有些不同。他們認為，當數據足夠優質、模型夠強大、架構夠靈活、工程夠紮實時，computer use、deep research、coding agent 等能力會自然湧現，無需被設計為特定的產品功能。

Manus 比起 Claude 的 Computer use 等同樣能操作多任務，可涵蓋更多領域和達成更高的執行品質。Manus 在權威的 GAIA 基準測試中創下新紀錄，性能遠超 OpenAI 等同類產品。Manus 為拉丁語 Mens et Manus，即 mind and hand，意指手腦並用，這也是麻省理工學院的校訓，以此鼓勵學生將創意落地為實際成果。

作為大力出奇跡的代表之一的 GPT-4-Turbo，在 GAIA 公開排行榜上的平均成績不到 7%，即使是使用複雜多智慧體系統的解決方案也僅達 40%。Manus 的表現可以說是「遙遙領先」。

但中國 AI 新媒體《APPSO》指出，很難現在就判定 Manus 誕生就是通用 AI 里程碑，但它很有可能將讓 Agent(智慧體) 時代真的進入「高潮時刻」。

Manus 的出現意味著 Agent 模式下的 AI 能理解需求後獨立工作，直到任務完成，這無疑是人機交互領域的一大步，它讓我們看到 AI 從工具向夥伴轉變的潛力。

但要說人類已經一隻腳邁入了通用 AI 大門，也還為時尚早。Monica.im 創辦人肖弘自己也提到，早期的 Agent 更像是「功能機」，需要不斷反覆運算和完善，目前則仍需依賴於模型能力的提升，以及更完善的虛擬環境支援，才能真正勝任各種長尾任務。

雖然 Manus 在 GAIA 基準測試中表現出色，但這並不代表 Manus 已具備通用 AI 的全部特徵。通往 AGI 的道路依然漫長，需要解決模型能力、自主學習、任務泛化等多重挑戰。