軟體工程師只剩6個月? Anthropic CEO斷言AI將接管程式碼、AGI要來了
鉅亨網新聞中心
在瑞士達沃斯舉行的世界經濟論壇上,Anthropic 執行長 Dario Amodei 在與 Google(GOOGL-US) DeepMind 執行長 Demis Hassabis 的一場對談中拋出震撼預測,直言人工智慧(AI)「端到端」接管軟體工程師幾乎全部工作的時間點,可能只剩下 6 至 12 個月。

Amodei 與 Hassabis 此次罕見同台,展開一場關於通用人工智慧(AGI)未來的深度對談。這場長達半小時的談話,釋放出一個明確訊號:AGI,真的正在逼近。
Amodei 認為,離 AGI 到來時間可能只剩下一到兩年;Hassabis 則判斷,真正具備科學創造力的 AGI,恐怕仍需五到十年。
值得注意的是,與去年在巴黎的對話相比,兩人此次的語氣明顯多了幾分緊迫感。他們不再只是討論「是否可能」,而是聚焦在一個令人興奮又不安的問題,AGI 到來後的「第一天」,世界會變成什麼模樣。
Amodei 指出,AI 自我進化的關鍵「閉環」已經啟動。以 Anthropic 為例,工程師如今不再從零撰寫程式碼,而是將任務交給 Claude 生成初稿,人類角色則轉為提出需求、審查程式碼與把關整體架構,更接近產品經理或系統架構師。
Amodei 更透露,Claude Cowork 的核心模組,正是由 Claude 自行在一週半內完成。
基於這樣的進展,他大膽預測,世界離 AI 模型「端到端」完成軟體工程師絕大部分、甚至全部工作,可能只剩下 6-12 個月。
所謂的「端到端」代表涵蓋一項軟體產品從誕生到上線、乃至維運的完整生命週期,包括需求規劃、系統設計、前後端開發、部署與測試等各個環節。
Amodei 與 Hassabis 也幾乎同時坦承,通往 AGI 的路徑正變得前所未有地清晰。
隨著模型規模持續擴張、多模態能力成熟,以及 AI 代理的自主性不斷提升,AGI 的出現已成為時間問題。
SWE-Bench 成績曝光:AI 已逼近中高階工程師
分析指出,如此看來,Anthropic 似乎已率先在軟體開發領域,實現接近 AGI 水準的能力,尤其是在內部員工可不限量使用 Claude 的情況下,更加凸顯這一點。
為了具體衡量這種能力,業界常以專門用來評估大型語言模型解決真實世界軟體工程問題能力的黃金標準 SWE-Bench 作為參考。
SWE-Bench 測試被視為一個「實戰考場」,用來評估模型在真實 GitHub 程式碼庫中定位問題、進行跨檔案修改、通過測試,並提交可用 CI 修補程式的整體能力。
SWE-Bench 原始資料集約包含 2,294 個任務,實務上經常引用的是經 OpenAI 人工標註、難度經過整理的 Verified 子集。
在標準的 Bash Only 環境下,Claude 4.5 Opus 的任務解決率已達 74.4%,且每道題目的平均成本僅約 0.72 美元,顯示其在軟體工程任務上的效率與成熟度已相當驚人。
在這些測試任務中,難度可進一步細分為四個層級:
- 簡單任務(少於 15 分鐘):約 196 個任務,多屬於為函式加入斷言等基礎修改。
- 中等任務(15 分鐘至 1 小時):需要一定思考時間的小規模調整。
- 困難任務(1 至 4 小時):涉及函式重構或跨多個檔案的實質性改寫。
- 超難任務(超過 4 小時):往往需要大量背景研究,程式碼改動超過 100 行,屬於高度複雜的問題。
若將 SWE-Bench 的難度對應到現實中的大型科技公司職級,情況顯得更加震撼:
少於 1 小時即可完成的「簡單」至「中等任務」,大致相當於初級工程師(Junior/SDE1)的能力水準,對應 Google L3、阿里巴巴 (09988-HK) P5–P6、字節跳動 1-1/1-2 等職級,通常為 0 至 3 年工作經驗。
需要 1 至 4 小時處理的「困難任務」,則已接近中高階工程師(Senior/SDE2–SDE3),相當於 Google L4–L5、阿里巴巴 P6–P7、字節跳動 2-1/2-2,具備約 3 至 7 年經驗。
這類任務不再只是單一檔案修改,往往必須跨檔案調整,平均涉及約 32.8 行程式碼、1.7 個檔案。
至於超過 4 小時的「超難任務」,則屬於資深或專家級工程師(Staff 以上)範疇,對應 Google L6 以上、阿里巴巴 P7–P8、字節跳動 3-1 級別及更高職位。
就現階段而言,即便是最先進的 AI 模型,在處理這類任務時仍面臨高度挑戰。
「超難任務」往往要求深度的上下文理解、跨層級的系統架構判斷,以及長時間、一致性的推理能力,這些都是目前 AI 仍相對薄弱的環節,使其整體表現尚顯吃力。
然而,這並未動搖 Amodei 所提出、AI 將在 6 至 12 個月取代軟體工程師幾乎全部工作的關鍵預判。
分析指出,隨著「AI 開發 AI」的正回饋飛輪加速運轉,模型能力的躍升不再遵循線性進展,從初級工程師水準(L3)推進至專家級(L6),或許只需數輪關鍵性的模型更新。
在此趨勢下,過往被視為難以逾越的「專家級」技術護城河,正以清晰可見的速度迅速流失,其防禦效力也正同步削弱。
五年內,一半初級白領恐消失
隨著技術飛輪持續加速,首當其衝遭到重塑的,正是既有的就業結構。
Amodei 曾預測,未來 1 至 5 年內,約有一半的初級白領職位將走向消失。
對此,主持人指出,從目前的統計數據來看,整體勞動市場尚未出現明顯動盪,並進一步追問:這是否只是所謂的「勞動總量固定謬誤」,也就是 AI 終將創造出更多新工作,抵消舊職位的流失?
Hassabis 回應表示,從短期觀察來看,AI 確實會催生新的工作型態,舊職位消退的同時,新職位也將出現,而且往往更具附加價值與意義。
然而,他也坦言,自己已明顯感受到初級與入門級職位、以及實習招聘的整體節奏正在放緩。
他因此鼓勵年輕世代,必須高度熟練並深入運用當前的 AI 工具。Hassabis 指出,即便是親手打造模型的研究人員,也難以完全釐清現階段模型所蘊含的「能力懸溢」,更遑論未來版本的潛能。
他認為,深度使用與駕馭 AI,可能比傳統實習更能幫助年輕人迅速放大專業影響力,實現能力躍升。
Hassabis 也強調,一旦 AGI 真正到來,人類社會將進入高度不確定的未知領域。
相較之下,Amodei 的態度則更加直白且冷峻。他再次點出一個不容忽視的時間節點:2026 年前後,未來 1 至 5 年內,約有一半初級白領工作可能消失。
他進一步指出,在 1 至 2 年內,人類或許將面對在多數認知與執行層面全面超越人類的 AI 系統。
Amodei 表示,他已在多個領域看到明確徵兆,尤其是在軟體與程式開發方面。
Anthropic 內部的數據顯示,初級與中級職位需求正快速下滑,公司也已開始嚴肅思考,如何以更人性化的方式因應裁員與職能轉型。
他坦承,歷史上人類社會曾多次成功適應技術變革,例如農業自動化後,約八成農民轉入工業部門,隨後再轉向知識型工作。
然而,這一波 AI 變革的本質截然不同:指數級成長所帶來的複利效應過於猛烈,人類社會的調適速度恐難以跟上。
Amodei 警告,就業衝擊或許會因滯後效應而延遲顯現,但一旦全面爆發,其影響將對整體社會結構形成強烈擠壓。
展望更長遠的未來,Hassabis 拋出一個超越經濟層面的終極提問:在一個後稀缺的世界中,當工作不再是生存的必要條件,人類將如何重新定義自身存在的意義?
延伸閱讀
- AGI是「明年就來」還是「十年之後」?Anthropic的Amodei與DeepMind的Hassabis達沃斯交鋒
- AI泡沫疑慮升溫 黃仁勳反而喊話:還要更多投資
- Meta AI真的追上了?新團隊首度交付模型
- 押注財報行情 花旗首選四大半導體股
- 講座
- 公告
上一篇
下一篇