menu-icon
anue logo
熱門時事鉅亨號鉅亨買幣
search icon

美股

遭大規模網路攻擊 DeepSeek限制註冊

鉅亨網編譯羅昀玫 2025-01-28 00:33

cover image of news article
遭大規模網路攻擊 DeepSeek限制註冊 (圖:shutterstock)

中國 AI 新創公司 DeepSeek 週二 (28 日) 宣布,由於其服務遭到大規模網路攻擊,該公司暫時限制新用戶註冊,但現有用戶能照常登入。

DeepSeek 最新聲明指出,近期 DeepSeek 線上服務受到大規模惡意攻擊,為持續提供服務,暫時限制了 + 86 手機號以外的註冊方式,已註冊用戶可以正常登錄,感謝理解和支持。


(圖片:)
(圖片:DeepSeek)
DeepSeek 掀科技股大屠殺

DeepSeek 的出現正在動搖投資人對過去兩年美股 AI 多頭信心。它使人們對圍繞輝達等 AI 概念股炒作產生質疑,並一路波及整個市場,打擊了原本有望從 AI 資料中心需求中獲得提振的電力生產商的股價。

AI 霸主輝達 (NVDA-US) 週一血崩 16.86% 至每股 118.58 美元,市值蒸發 5890 億美元,創下美股史上最大的單日市值蒸發規模,打破去年 9 月初的紀錄 (2,790 億美元)。

花旗分析師表示,DeepSeek 新聞發布後,運算成本已成為人們討論的關鍵議題。

他們表示,雖然美科技巨頭在最先進 AI 模型上的主導地位可能會受到威脅,但競爭對手的一個關鍵障礙是獲得最好的晶片。分析師表示,正因為如此,領先的 AI 公司可能不會放棄更先進的 GPU。

他們補充說,上週美國總統川普宣布的 5000 億美元「Stargate」(星際之門) 計畫是「對先進晶片需求的認可」。

Bernstein 分析師對 DeepSeek 工具的實際開發成本是否低於 600 萬美元表示懷疑。他們質疑這個數字是否排除了先前研究和實驗的其他成本,以使該技術達到今天的水平。

Bernstein  團隊表示,儘管 DeepSeek 的模型看起來很棒,但不需要認為這是奇蹟,那些關於 AI 基礎設施「喪鐘」的說法被過度渲染了。

爆紅 DeepSeek 嚇壞矽谷

DeepSeek 公司由 Huanfang Quantitative 於 2023 年 7 月創立,被業界譽為「AI 界的拼多多」。

DeepSeek 先後發布了 DeepSeek- V3 和 DeepSeek- R1 兩款大模型,受到市場矚目,由於 DeepSeek 訓練其最新模型之一的成本為 560 萬美元,僅為 OpenAI 最新大模型的 30 分之一,性能卻與 OpenAI 相當,讓矽谷震驚不已。

DeepSeek 作為 OpenAI 的 ChatGPT、Google 的 Gemini 和其他領先人工智慧工具的快速成長的競爭對手。

週一早些時候,DeepSeek 開發的大型模型應用程式在中國和美國的蘋果 Apple Store 免費下載排行榜上均名列第一。

DeepSeek 應用程式的成功,與其背後的 DeepSeek-R1 模型有密切關係。R1 模型以其「品質好、價格低」的特性,在開發者社群中引起了轟動。該模型是開源的,並採用 MIT 許可協議,支援免費商業使用、任意修改和衍生開發。

DeepSeek R1 在數學、程式碼和自然語言推理等任務中的表現可與 OpenAI 的 o1 模型相媲美。在國外的大型模型排名榜 Chatbot Arena 上,DeepSeek-R1 的基準排名已上升到所有類別中的第三名,與最新版本的 OpenAI 的 ChatGPT-4o 並列。

在風格控制模型 (StyleCtrl) 類別中,R1 模型也與 OpenAI 的 o1 模型並列第一。

DeepSeek V3 是一種先進的語言模型,採用 混合專家 (MoE) 架構,具有 6710 億個參數。它針對不同類型的任務使用多個專業的子網路 (專家) ,並使用路由機制將每個輸入導向最合適的專家。V3 模型在每個任務中選擇性地啟動 370 億個參數,在不犧牲效能的情況下降低了計算成本。

DeepSeek R1 則是一款在 AI 推理能力方面有重大進展的模型。它專門處理需要精確邏輯思維、數學問題解決和程式碼專業知識的任務。R1 模型基於強化學習原則的架構,透過試錯學習,發展出類似人類推理的解決問題策略。

文章標籤


Empty