鉅亨網編譯陳韋廷
AI 公司 Anthropic 因內容管理系統配置失誤,意外曝光代號「Capybara」的全新模型 Claude Mythos 相關內部文件,揭露一款被形容為「能力飛躍」、卻也帶來前所未見網路安全風險的下一代 AI 系統。Claude Mythos 是一款具有劃時代意義的全新模型。

Anthropic 此次外洩文件近 3000 份,包含未發布的部落格草稿與產品規劃,迅速在科技圈掀起波瀾。
根據《財富 (Fortune)》雜誌取得的資料,Claude Mythos 已完成訓練,定位為超越現行最強模型 Opus 的全新層級,在程式編寫、學術推理與網路安全等測試中表現遠優於 Claude Opus 4.6。
然而,Claude Mythos 強大的網路攻防能力卻令 Anthropic 自身感到擔憂。
文件顯示,Anthropic 公司內部評估指出,Mythos「預示著即將出現一波新型模型,其利用漏洞的能力將遠超過防禦者的應對速度」,因此決定採取較過往更謹慎的發布策略。
外洩的部落格草稿進一步說明,由於 Mythos 屬於大型且計算密集的模型,運作成本極高,公司將先以早期體驗形式提供給特定組織,尤其側重於網路防禦應用,旨在協助相關單位在 AI 驅動的攻擊浪潮來臨前,強化其程式碼庫的穩健性。
此外,文件亦意外披露執行長 Dario Amodei 將參與一場於英國莊園舉辦的歐洲企業執行長閉門峰會,疑似為新產品進行高端推廣。
Anthropic 已向《財富》證實確有開發此模型,並將其描述為 AI 能力的「重大飛躍」,但強調因配置疏失而外洩的內容包含未定稿資訊與廢棄素材。
Anthropic 發言人表示,此次事件源於一個外部內容管理工具的設定錯誤,目前已封鎖相關資料存取路徑。
此次外洩不僅提前揭露 AI 競賽的下一階段進展,更突顯尖端技術的雙面刃本質,也就是當模型的智慧與能力達到新高度,其潛在風險與社會影響也將同步加劇,迫使開發者必須在創新與安全之間取得更艱難的平衡。
上一篇
下一篇