提前近10月!AI預測權威:進化速度超預期 年底實現「AI研發自動化」真的有可能
鉅亨網編譯陳韋廷
AI 進步速度正讓最嚴謹的預測者都措手不及,知名 AI 預測研究員 Ajeya Cotra 近期坦承,她在兩個月前才提出的 2026 年 AI 進展預測,如今看來已明顯過於保守。

觸發她自我修正的關鍵是 Anthropic 最新模型 Claude Opus 4.6 在權威評測機構 METR 基準測試中的表現,該模型在軟體工程任務上的「時間跨度」已達約 12 小時,遠超 Cotra 原先預測今年底才會達到的 24 小時水準,這意味 AI 在軟體工程領域的實際進展,比她的預測提早近 10 個月。
更引人關注的是,Cotra 隨後上調對「AI 研發全面自動化」的機率判斷。她維持今年底前 AI 完全接管研究構想與執行、無需人類介入的機率為 10%,並直言道「這是我第一次找不到任何可以外推的穩固趨勢,來斷言這件事不會很快發生。」這番言論在 AI 預測圈引起廣泛討論。
Cotra 曾在 AI 安全資助機構 Coefficient Giving 擔任主管,現在服務於專注 AI 能力評估的 METR。
今年 1 月 14 日,Cotra 根據 2019 至 2025 年間 AI「時間跨度」約每年倍增不到兩次的趨勢,預測 2026 年底最先進模型的 50% 成功率時間跨度約為 24 小時,80 百分位為 40 小時。
但兩個月後,Opus 4.6 已在 METR 測試中,對 19 項估計需人類耗時逾 8 小時的軟體工程任務,至少完成 14 項,並穩定攻克其中 4 項。
她坦言,在還剩 10 個月進展的情況下,AI 代理若在 24 小時任務上仍有一半失敗,「已不再可信」。
Cotra 也提醒,當前時間跨度估算的不確定性顯著上升。Opus 4.6 的 95% 信賴區間為 5.3 至 66 小時,原因包括長任務樣本稀少、人工耗時多為估算,以及基準測試接近飽和。
隨著 AI 能力逼近甚至超越數十小時量級,Cotra 認為「時間跨度」概念本身正受挑戰。
她指出,任務可分解性隨規模增加:一小時的除錯幾乎無法拆解,一天開發勉強可分工,而數月專案則天然適合平行子任務。一旦 AI 能穩定完成 80 小時任務,理論上可透過「管理 AI」分配、「執行 AI」並行,持續推進任意規模專案。
在所有預測中,最矚目的是 Cotra 對「AI 研發全面自動化」的判斷。她定義此為 AI 系統完全承擔研究構想與執行,無需人類參與。
今年 1 月,她給出 10% 機率,遭同行認為偏高,但 Opus 4.6 表現出爐後,她認為 10%「再次感覺合理」。她仍保持審慎,指出全面自動化除需軟體工程能力,還需在「研究判斷力」與「創造力」取得突破,而這些正是當前 AI 相對人類的短板。
Cotra 也認為此目標未來三至五年實現的可能性,遠高於今年,但她的基調已轉變:「我第一次找不到穩固趨勢,可斷言它不會很快發生。」
- 免費體驗5萬美元模擬交易 投資全球資產
- 掌握全球財經資訊點我下載APP
延伸閱讀
- Anthropic控告美國政府阻列黑名單!高層警告:恐衝擊數十億美元營收
- AI軍事紅線爆衝突!Anthropic提告五角大廈
- 微軟導入Anthropic技術 推出Copilot Cowork搶攻AI代理市場
- 美政府祭AI新規:模型須允許「任何合法用途」、Anthropic被列供應鏈風險
- 講座
- 公告
下一篇