科技

提前近10月！AI預測權威：進化速度超預期年底實現「AI研發自動化」真的有可能

鉅亨網編譯陳韋廷2026-03-10 15:20

AI 進步速度正讓最嚴謹的預測者都措手不及，知名 AI 預測研究員 Ajeya Cotra 近期坦承，她在兩個月前才提出的 2026 年 AI 進展預測，如今看來已明顯過於保守。

cover image of news article — 提前近10月！AI預測權威：進化速度超預期年底實現「AI研發自動化」真的有可能(圖:shutterstock)

觸發她自我修正的關鍵是 Anthropic 最新模型 Claude Opus 4.6 在權威評測機構 METR 基準測試中的表現，該模型在軟體工程任務上的「時間跨度」已達約 12 小時，遠超 Cotra 原先預測今年底才會達到的 24 小時水準，這意味 AI 在軟體工程領域的實際進展，比她的預測提早近 10 個月。

‌

更引人關注的是，Cotra 隨後上調對「AI 研發全面自動化」的機率判斷。她維持今年底前 AI 完全接管研究構想與執行、無需人類介入的機率為 10%，並直言道「這是我第一次找不到任何可以外推的穩固趨勢，來斷言這件事不會很快發生。」這番言論在 AI 預測圈引起廣泛討論。

Cotra 曾在 AI 安全資助機構 Coefficient Giving 擔任主管，現在服務於專注 AI 能力評估的 METR。

今年 1 月 14 日，Cotra 根據 2019 至 2025 年間 AI「時間跨度」約每年倍增不到兩次的趨勢，預測 2026 年底最先進模型的 50% 成功率時間跨度約為 24 小時，80 百分位為 40 小時。

但兩個月後，Opus 4.6 已在 METR 測試中，對 19 項估計需人類耗時逾 8 小時的軟體工程任務，至少完成 14 項，並穩定攻克其中 4 項。

她坦言，在還剩 10 個月進展的情況下，AI 代理若在 24 小時任務上仍有一半失敗，「已不再可信」。

Cotra 也提醒，當前時間跨度估算的不確定性顯著上升。Opus 4.6 的 95% 信賴區間為 5.3 至 66 小時，原因包括長任務樣本稀少、人工耗時多為估算，以及基準測試接近飽和。

隨著 AI 能力逼近甚至超越數十小時量級，Cotra 認為「時間跨度」概念本身正受挑戰。

她指出，任務可分解性隨規模增加：一小時的除錯幾乎無法拆解，一天開發勉強可分工，而數月專案則天然適合平行子任務。一旦 AI 能穩定完成 80 小時任務，理論上可透過「管理 AI」分配、「執行 AI」並行，持續推進任意規模專案。

在所有預測中，最矚目的是 Cotra 對「AI 研發全面自動化」的判斷。她定義此為 AI 系統完全承擔研究構想與執行，無需人類參與。

今年 1 月，她給出 10% 機率，遭同行認為偏高，但 Opus 4.6 表現出爐後，她認為 10%「再次感覺合理」。她仍保持審慎，指出全面自動化除需軟體工程能力，還需在「研究判斷力」與「創造力」取得突破，而這些正是當前 AI 相對人類的短板。

Cotra 也認為此目標未來三至五年實現的可能性，遠高於今年，但她的基調已轉變：「我第一次找不到穩固趨勢，可斷言它不會很快發生。」

原物料行情正面臨哪些關鍵轉折？
掌握全球財經資訊點我下載APP

‌

文章標籤

AI Anthropic Claude Opus 4.6 METR Ajeya Cotra 時間跨度 AI研發自動化

延伸閱讀

鉅亨講座

看更多

講座
公告

提前近10月！AI預測權威：進化速度超預期 年底實現「AI研發自動化」真的有可能

文章標籤

相關行情

延伸閱讀

鉅亨講座

‌

‌

‌

‌

提前近10月！AI預測權威：進化速度超預期年底實現「AI研發自動化」真的有可能