menu-icon
anue logo
熱門時事鉅亨號鉅亨買幣
search icon

美股

DeepSeek超低成本特性 引發AI技術過高成本質疑 恐衝擊產業

鉅亨網新聞中心 2025-01-27 09:45

cover image of news article
DeepSeek超低成本特性 引發AI技術過高成本質疑 恐衝擊產業(圖:shutterstock)

據《Zerohedge》報導,中國的 DeepSeek 公司推出了一款名為 R1 的人工智慧模型,該模型在編碼、數學和一般知識能力方面表現優異,更重要的是,其成本遠低於競爭對手,這對美國在人工智慧領域的領導地位構成了挑戰。

DeepSeek R1 的開源性質使其程式碼可以公開存取、修改和分發,這與 OpenAI 等公司的封閉原始碼模式形成對比。


DeepSeek R1 主要特點

報導總結 DeepSeek R1 的特點包括:

效能優越且成本低廉:DeepSeek R1 的效能與 OpenAI 的最新模型 o1 相媲美,但在運行成本上卻僅需一小部分。有人將其比作推出一款與 iPhone 性能相當,但售價僅為 30 美元的智慧型手機。

開源性質:R1 是開源的,這意味著任何人都可以免費下載並運行它。這種模式促進了分散式協作開發,並允許使用者根據自己的需求修改程式碼。

模擬推理能力:DeepSeek R1 使用模擬人類思維鏈的方式解決問題,這被稱為「模擬推理」模型。該模型在數學推理測試 (如 AIME 和 MATH-500) 以及程式設計評估工具 SWE-bench Verified 等基準測試中,表現優於 OpenAI 的 o1 模型。

成本效益:DeepSeek 的模型顯示,訓練基礎人工智慧模型可以採用不同的方法,以更低的成本達到相同的結果。有人指出,訓練 DeepSeek 的模型只需 5500 萬美元,而業界可能需要花費數十億美元才能達到類似的效能。

對美國科技產業潛在影響

報導認為,DeepSeek R1 的出現,對美國在人工智慧領域的領導地位構成威脅。該模型以極低的成本,打破了美國公司在 AI 技術方面的壟斷。

DeepSeek 的成功讓業界質疑在 AI 技術上投入數百億美元的必要性。一些人認為,中國的量化基金可能會導致那斯達克崩盤。

DeepSeek R1 的開源和低成本,預示著 AI 可能會像電力或網際網路一樣,成為一種廣泛可用且價格合理的公共事業,而非少數企業控制的獨家服務。

DeepSeek 熱潮

上周,中國人工智慧實驗室 DeepSeek 在 MIT 開放許可下發布了其新的 R1 模型系列,其最大版本包含 6,710 億個參數。該公司聲稱,該模型在多個數學和編碼基準測試中的表現與 OpenAI 的 o1 模擬推理 (SR) 模型相當。

該版本的發布立即引起了人工智慧社群的關注,因為大多數現有的開放權重模型在所謂的推理基準測試中已經落後於 OpenAI 的 o1 等專有模型。

R1 模型的工作方式與典型的大型語言模型不同。它們試圖在模型解決查詢的過程中模擬類似人類的思維鏈。當 OpenAI 於 2024 年 9 月推出其 o1 模型系列時,就出現了這類所謂的「模擬推理」模型,簡稱 SR 模型。

DeepSeek 報告稱,R1 在多個基準測試和測試中均優於 OpenAI 的 o1,包括 AIME(數學推理測試)、MATH-500(一組文字問題) 和 SWE-bench Verified(程式評估工具)。

根據 TechCrunch 報導,三家中國實驗室—DeepSeek、阿里巴巴和 Moonshot AI 的 Kimi,已經發布他們自認為可與 OpenAI 的 o1 功能相匹配的模型。


Empty