menu-icon
anue logo
馬來西亞房產鉅亨號鉅亨買幣
search icon


美股

競爭對手破天荒合作 OpenAI、Anthropic已完成相互AI安全評估

鉅亨網編譯王貞懿


據《彭博》報導,AI 領域兩大競爭對手 OpenAI 和 Anthropic 周三 (27 日) 宣布,已於今年夏天完成相互評估對方 AI 模型的安全性,測試虛假資訊生成和模型偏離預期行為等問題,這是業界首次大規模跨實驗室安全測試合作。

cover image of news article
面對安全爭議,OpenAI和Anthropic化敵為友,已完成相互模型安全檢測。(圖:Shutterstock)

兩家公司周三在各自部落格發文宣布將相互測試AI模型安全性的訊息。(圖:OpenAI)
兩家公司周三在各自部落格發文宣布將相互測試 AI 模型安全性的訊息。(圖:OpenAI)

這次合作格外引人注目,因為 Anthropic 正是由前 OpenAI 員工創立。OpenAI 稱此為「安全性測試的首次大規模跨實驗室行動」,希望為「業界安全評估提供有價值途徑」。

評估工作已經在 OpenAI 發布 GPT-5,以及 Anthropic 於 8 月初推出 Claude Opus 4.1 之前完成。

AI 公司面臨日益嚴峻的安全壓力,一連串報告指出重度使用這些模型可能導致有害行為。本周稍早一起訴訟指控 OpenAI,聲稱青少年使用聊天機器人後自殺。

Anthropic 由前 OpenAI 研究副總裁 Dario Amodei 等人於 2021 年創立,專注開發「有用、無害、誠實」的 AI 系統。儘管存在競爭關係,但面對安全挑戰時選擇合作。

透過相互評估,公司能發現單一組織測試的盲點,提升整體安全水準。這項合作可能為 AI 產業建立新的自律機制。

隨著 AI 技術快速發展,確保系統按預期運作並避免有害內容變得更加重要。這次跨公司合作顯示,即使在激烈競爭中,安全考量仍能促成昔日對手的協作。

兩家公司表示,這次評估為未來更廣泛產業合作奠定基礎,有助建立完善的 AI 安全評估框架。

(本文不開放合作夥伴轉載)



Empty