DeepSeek
阿里巴巴 (09988-HK)(BABA-US)Qwen 團隊周三 (5 日) 晚間發文宣佈最新研究成果 QwQ-32B 大語言模型,在僅有 DeepSeek-R1 約二十分之一參數量的情況下,用強化學習 (RL) 實現性能上的驚人跨越。Qwen 團隊在部落格文章中提到,他們深入探索 RL 在提升大語言模型智慧方面的巨大潛力,QwQ-32B 的成功發佈,有力地證明 RL 是提升模型性能的強大引擎。
中國目前唯一採用全國產算力訓練的深度推理大模型星火 X1 周一 (3 日) 全面升級,單機部署成本驟降,徹底顛覆行業應用門檻。中國 AI 媒體《新智元》報導,時隔一個半月,科大訊飛 (002230-CN) 的星火 X1 在數學能力上大幅躍升,僅以 70B 參數規模,便追平 ChatGPT o1 和 DeepSeek-R1,尤其是在競賽級難題上再攀高峰,在中小學實用任務,更是全面領先 DeepSeek-R1。
中國 DeepSeek R1 模型發佈以來,成爲改變整個行業格局的催化劑,根據瑞銀 (UBS-US) 近日對 20 家軟體公司進行的調查,企業客戶日益傾向利用 AI 作為生產力和收入成長的驅動力,因 DeepSeek R1 使成本下降。DeepSeek R1 是一個強大的開源推理模型,其 API 成本為每 100 萬 tokens 人民幣 16 元,對企業來說較為實惠。
橋水基金創始人達利歐上月在最新表示,美國可能在 AI 晶片開發上暫時領先,但中國將繼續擁有為這些晶片製造應用程式的力量,而且這種情況不會很快改變。達利歐上個接受福斯新聞前主播 Tucker Carlson 專訪時表示,儘管美國晶片效率略勝一籌,但在大規模生產半導體晶片和開發應用 AI 方法,中國比美國更有優勢。
除汽車行業外,小米也在攪動家電江湖,上周四 (2 月 27 日) 發佈要跟大金空調競爭、要價人民幣 2.9 萬元的中央空調系統,小米高管更放話稱「給行業一點震撼」。去年,小米在中國的空調銷量位居第四,今年目標是成為第三名。統計數據顯示,在 2023 年 10 月至 2024 年 9 月,包含家電在內的物聯網與生活消費產品領域的營收約 930 億人民幣,是小米第二大收入源。
科技
自宇樹科技機器人在春晚爆紅及 DeepSeek 橫空出世震驚全球後,杭州一時之間成為世界目光,在這些令世界驚歎的顛覆者產品背後,都跟浙江大學這個名字緊密相連。中國《投資家》雜誌報導,作為國內最早開展機器人本科教學的高校之一,浙大早已是機器人創新創業的沃土,依靠率先發展,尤其產學研的協同,浙大跑出了一支機器人天團。
中國 AI 新創公司 DeepSeek 近來「開源」一波波,上周六 (1 日) 又有更大驚喜,全面揭秘 DeepSeek-V3/R1 推理系统,不僅公開其推理系統的核心優化方案,更首次披露成本獲利率等關鍵數據,引發產業震動。DeepSeek 上周六在知乎平台發佈首條文章,公佈模型推理成本利潤細節,並披露成本獲利率關鍵資訊,若所有 tokens 全按 DeepSeek-R1 的定價計算,理論上一天的總收入為 56 萬 2027 美元,成本獲利率為 545%,這一數字刷新全球 AI 大模型領域的獲利天花板。
雜誌
文.洪寶山1990 年底香港恒生指數收在 3024 點,當時台灣加權指數收在 4530 點,相信那一年的背景很多人都知道,著名的波斯灣戰爭成為港劇《大時代》的大奇蹟日的背景,也就是說,經過那一年的股市崩盤後,加權指數還比恒生指數高了 1506 點。
各家大模型紛紛推出深度思考模型之際,中國互聯網大廠騰訊 (00700-HK) 上周四 (2 月 27 日)「反常」地推出快思考模型 Turbo S,並在騰訊雲和元寶上線。目前,開發者和企業用戶可在騰訊雲上通過 API 調用騰訊混元 Turbo S,免費試用一周,開發團隊稱「比大模型界的拼多多還便宜」。
DeepSeek 在其開源週的最後一天,隆重推出了兩款顛覆性的資料處理工具:Fire-Flyer File System (3FS) 和 Smallpond。這兩款工具以其卓越的效能和極高的吞吐量,能夠輕鬆處理 PB 級的數據,標誌著數據處理技術的一個新里程碑。
美股雷達
在 DeepSeek 熱潮帶動下,出於性價比、合規性考慮,中國大廠對輝達(Nvidia)(NVDA-US) 「中國特供版」晶片 H20 的需求旺盛,一位受訪輝達經銷商稱 H20 已成為大廠最愛。據《財聯社》周四(27 日)報導,TrendForce 集邦咨詢分析師龔明德表示,從人工智慧(AI)伺服器市場觀察,目前中國市場主要 GPU 供應仍以 H20 等為主力。
專家觀點
【輝達財報優於預期站穩 AI 霸主地位】輝達清晨公布最新去年第四季財報,再度繳出優於市場預期數字,Q4 營收 393.31 億、每股 EPS0.89 美元都擊敗市場預期,唯一美中不足之處在於毛利率 73% 較上個季度與去年同期下滑,但亮眼的財報數字也再度證明,輝達 (NVDA-US) 仍是 AI 的霸主,輝達執行長黃仁勳也談到,市場對於 Blackwell 的需求非常驚人,光去年第四季業務收入就達到 110 億美元,而輝達也將擔任星際之門計畫的關鍵技術合作夥伴、全球 500 大最強力的超級電腦系統,也有 75% 用輝達技術。
中國 A 股三大指數周四 (27 日) 收盤表現漲跌不一,僅上證指數(SSEC) 收紅,但滬深兩市成交額重返 2 兆人民幣水位。滬指周三收紅 0.23% 報 3388.06 點,深證成指 (SZI) 收低 0.26% 至 10927.51 點,創業板指收黑 0.52% 至 2256.51 點,滬深兩市成交額人民幣 2.0046 兆元,較前一交易日的 1.9384 兆元增加 662 億元。
DeepSeek 今 (27) 日又有大動作,推出並行計算優化三劍客 DualPipe、EPLB 以及 profile-data,其中一口氣開源兩項堪稱「AI 訓練加速神器」的技術,當中還有創辦人梁文鋒親自參與的 DualPipe 專案。專家認為,這對於動輒需要數百萬美元、耗時數月的大模型訓練來說是一劑「強心針」。
DeepSeek 在開源周第四天一連更新 DualPipe、EPLB 以及深入分析 V3/R1 模型中計算與通信重疊機制的優化並行策略等三項專案,讓大模型訓練更快,成本更低,還能保持頂尖性能,值得一提的是,DualPipe 是由 Jiashi Li、Chengqi Deng 和梁文峰共同研發。
自年初爆紅以來,DeepSeek 熱潮持續居高不下,而毫不意外地,中國科技巨頭阿里巴巴 09988-HK) 跟騰訊 (00700-HK) 紛紛宣布接入,且在這場 AI 戰爭中依舊拔得頭籌。DeepSeek 引起的 AI 熱潮為阿里雲貢獻百分之六、七十的新使用者。
最新研究顯示,新一輪 AI 熱潮將引發晶片半導體產業波動,今年全球 AI 晶片規模將超過 1500 億美元,2027 年增至 4000 億美元,最保守估計執亦達 1100 億美元。德勤中國日前發表《技術趨勢 2025》報告指出,多達 7 成企業正在極探索或應用大語言模型 (LLM)。
根據 Brookfield 公司執行長 Bruce Flatt 的說法,中國人工智慧 (AI) 新創公司深度求索 (DeepSeek) 的進展意味著,需要更多的資料中心容量 (Capacity) 來應對日益成長的 AI 工作量。Flatt 在周三 (26 日) 在倫敦接受彭博電視專訪時表示,隨著運行 AI 的成本逐漸下降,「更多的應用案例將會出現,這將是未來十年內的發展趨勢。
彭博周三 (26 日) 報導,輝達 (NVDA-US) 的財報將決定人工智慧 (AI) 是否能夠再次成為華爾街股市上漲的主要動力,或是隨著「美股七雄」進入修正區間,進一步帶來市場的疲弱。作為 AI 晶片領頭羊,輝達 2025 會計年度第四季財報,將成為今年最關鍵的事件之一,尤其是在中國新創公司深度求索 (DeepSeek) 的出現後,AI 基礎設施需求前景不確定性增加。
中國人工智慧 (深度求索) 新創公司 DeepSeek 周三 (26 日) 宣布,將在非高峰時段提供最高達 75% 的價格優惠,以應對其應用程式介面 (API) 的需求激增。自周三起,DeepSeek 的 V3 模型在北京時間每日凌晨 12:30 至早上 8:30 期間,使用價格將減半,而 R1 模型的價格則將下降至原價的四分之一。