美股

競爭對手破天荒合作 OpenAI、Anthropic已完成相互AI安全評估

鉅亨網編譯王貞懿2025-08-28 03:17

據《彭博》報導，AI 領域兩大競爭對手 OpenAI 和 Anthropic 周三 (27 日) 宣布，已於今年夏天完成相互評估對方 AI 模型的安全性，測試虛假資訊生成和模型偏離預期行為等問題，這是業界首次大規模跨實驗室安全測試合作。

‌

這次合作格外引人注目，因為 Anthropic 正是由前 OpenAI 員工創立。OpenAI 稱此為「安全性測試的首次大規模跨實驗室行動」，希望為「業界安全評估提供有價值途徑」。

評估工作已經在 OpenAI 發布 GPT-5，以及 Anthropic 於 8 月初推出 Claude Opus 4.1 之前完成。

AI 公司面臨日益嚴峻的安全壓力，一連串報告指出重度使用這些模型可能導致有害行為。本周稍早一起訴訟指控 OpenAI，聲稱青少年使用聊天機器人後自殺。

Anthropic 由前 OpenAI 研究副總裁 Dario Amodei 等人於 2021 年創立，專注開發「有用、無害、誠實」的 AI 系統。儘管存在競爭關係，但面對安全挑戰時選擇合作。

透過相互評估，公司能發現單一組織測試的盲點，提升整體安全水準。這項合作可能為 AI 產業建立新的自律機制。

隨著 AI 技術快速發展，確保系統按預期運作並避免有害內容變得更加重要。這次跨公司合作顯示，即使在激烈競爭中，安全考量仍能促成昔日對手的協作。

兩家公司表示，這次評估為未來更廣泛產業合作奠定基礎，有助建立完善的 AI 安全評估框架。

(本文不開放合作夥伴轉載)

‌