DeepSeek後最大驚喜!Manus成AGI里程碑?專家:難說 但有望掀AI智能體時代高潮
鉅亨網編譯陳韋廷 綜合報導 2025-03-07 11:00

中國 AI 產品 Manus 一夜刷屏,這是全球首款真正意義上的通用 AI Agent,從官網展示的案例可以看到它能獨立思考、規劃並執行複雜任務,直接交付完整成果,官網案例包括旅行規劃、股票分析、課程準備、保險政策比較、供應商採購、財務報告分析、電商運營分析等多個領域。
根據 Monica.im 介紹,Manus 不僅僅是一個只會聊天的對話式 AI 工具,而是一個真正的自主智慧體 (Agent)。當其他 AI 可能只停留在生成想法的階段,而 Manus 能獨立思考並採取行動。官方將其視為人機協作的新範式,甚至可能是通向 AGI 的一個視窗。
在一個演示案例中,結合家庭收入情況和孩子的上學要求讓 Manus 在紐約篩選一個安全、犯罪率低的社區,並購買符合標準的房子,而面對這類複雜任務,Manus 有條不紊地將其拆解為多個步驟,並創建詳細的待辦清單。搜索並閱讀關於紐約最安全社區的文章; 研究紐約的中學情況; 編寫 Python 程式來計算預算; 基於預算,在房地產網站上篩選合適的房源; 整合所有資訊,撰寫詳細報告並整理相關資料。
另一案例中,Manus 搖身一變成了專業股票分析師,讓 Manus 分析輝達、Marvell 及台積電過去 3 年股價之間相關性,Manus 可通過 API 訪問權威數據來源。在驗證數據後,Manus 開始編寫用於數據分析和可視化的代碼。
在完成數據分析和可視化後,Manus 也能基於這些數據創建一個網站。經使用者的授權後,還能將網站部署至線上,並提供一個可供分享的連結。
儘管 Manus 尚未全面開放,但其熱度已席捲全網。各大平台上,網友們紛紛深夜湧入評論區詢問邀請碼,火爆程度可見一斑。
Manus 的技術哲學為 less structure more intelligence,與主流有些不同。他們認為,當數據足夠優質、模型夠強大、架構夠靈活、工程夠紮實時,computer use、deep research、coding agent 等能力會自然湧現,無需被設計為特定的產品功能。
Manus 比起 Claude 的 Computer use 等同樣能操作多任務,可涵蓋更多領域和達成更高的執行品質。Manus 在權威的 GAIA 基準測試中創下新紀錄,性能遠超 OpenAI 等同類產品。Manus 為拉丁語 Mens et Manus,即 mind and hand,意指手腦並用,這也是麻省理工學院的校訓,以此鼓勵學生將創意落地為實際成果。
作為大力出奇跡的代表之一的 GPT-4-Turbo,在 GAIA 公開排行榜上的平均成績不到 7%,即使是使用複雜多智慧體系統的解決方案也僅達 40%。Manus 的表現可以說是「遙遙領先」。
但中國 AI 新媒體《APPSO》指出,很難現在就判定 Manus 誕生就是通用 AI 里程碑,但它很有可能將讓 Agent(智慧體) 時代真的進入「高潮時刻」。
Manus 的出現意味著 Agent 模式下的 AI 能理解需求後獨立工作,直到任務完成,這無疑是人機交互領域的一大步,它讓我們看到 AI 從工具向夥伴轉變的潛力。
但要說人類已經一隻腳邁入了通用 AI 大門,也還為時尚早。Monica.im 創辦人肖弘自己也提到,早期的 Agent 更像是「功能機」,需要不斷反覆運算和完善,目前則仍需依賴於模型能力的提升,以及更完善的虛擬環境支援,才能真正勝任各種長尾任務。
雖然 Manus 在 GAIA 基準測試中表現出色,但這並不代表 Manus 已具備通用 AI 的全部特徵。通往 AGI 的道路依然漫長,需要解決模型能力、自主學習、任務泛化等多重挑戰。
- 掌握全球財經資訊點我下載APP
延伸閱讀
上一篇
下一篇