DeepSeek
中國網信辦、工信部、科技部和國家知識產權局在內的八部門近日傳出正聯合起草一項重磅級政策,鼓勵在全國範圍內使用開源 RISC-V 晶片。有別於傳統的指令集,RISC-V「生而開源」,開發者可根據需要自由組合,搭建出不同的晶片。2010 年,美國柏克萊加州大學一個團隊領導研發第五代精簡指令集架構 RISC-V,並宣佈對外開源。
中國 AI 新創公司 Monica 共同創辦人、首席科學家季逸超 (Peak) 周一 (10 日) 在社群平台透露,Manus 使用了 Claude 大模型和不同的阿里千問 (Qwen) 大模型的微調模型開發。Claude 是美國 AI 新創公司 Anthropic 發佈的大語言模型家族,擁有高級推理、視覺分析、代碼生成、多語言處理、多模態等能力。
人工智慧 (AI) 技術進入高速發展階段,從生成式 AI 到自動駕駛、醫療影像分析等應用場景,全球對於算力的需求正以指數級增長。輝達執行長黃仁勳指出,新一代 AI 模型所需的算力比早期 ChatGPT 時代高出百倍,次世代 AI 演算法所需的算力可能是當前的數百萬倍,在這樣的背景下,EDA(電子設計自動化)與 ASIC(應用專用積體電路)技術成為加速 AI 發展的關鍵,也讓台灣矽智財相關企業站上了全球半導體供應鏈的戰略高地。
美股雷達
一位知情人士週五 (7 日) 表示,基於擔憂國家安全,川普政府正考慮禁止在政府公用設備上使用中國 AI 新創公司 DeepSeek 的聊天機器人。《華爾街日報》週五率先報導,美國官員對 DeepSeek 對用戶資料的處理方式感到擔憂,DeepSeek 將用戶資料儲存在位於中國伺服器中。
中國科技巨頭今年強勁反彈,市值總計飆升 4390 億美元,讓曾經不可戰勝的美國同行望塵莫及。許多投資者表示,這種情況還會進一步持續。法國興業銀行將阿里巴巴 (09988-HK)(BABA-US) 及騰訊 (00700-HK) 等七家中國科技龍頭企業,組成「中國七雄」等權重指數,今年已上漲超過 40%。
阿里巴巴 (09988-HK)(BABA-US)Qwen 團隊周三 (5 日) 晚間發文宣佈最新研究成果 QwQ-32B 大語言模型,在僅有 DeepSeek-R1 約二十分之一參數量的情況下,用強化學習 (RL) 實現性能上的驚人跨越。Qwen 團隊在部落格文章中提到,他們深入探索 RL 在提升大語言模型智慧方面的巨大潛力,QwQ-32B 的成功發佈,有力地證明 RL 是提升模型性能的強大引擎。
A股
中國目前唯一採用全國產算力訓練的深度推理大模型星火 X1 周一 (3 日) 全面升級,單機部署成本驟降,徹底顛覆行業應用門檻。中國 AI 媒體《新智元》報導,時隔一個半月,科大訊飛 (002230-CN) 的星火 X1 在數學能力上大幅躍升,僅以 70B 參數規模,便追平 ChatGPT o1 和 DeepSeek-R1,尤其是在競賽級難題上再攀高峰,在中小學實用任務,更是全面領先 DeepSeek-R1。
科技
中國 DeepSeek R1 模型發佈以來,成爲改變整個行業格局的催化劑,根據瑞銀 (UBS-US) 近日對 20 家軟體公司進行的調查,企業客戶日益傾向利用 AI 作為生產力和收入成長的驅動力,因 DeepSeek R1 使成本下降。DeepSeek R1 是一個強大的開源推理模型,其 API 成本為每 100 萬 tokens 人民幣 16 元,對企業來說較為實惠。
科技
橋水基金創始人達利歐上月在最新表示,美國可能在 AI 晶片開發上暫時領先,但中國將繼續擁有為這些晶片製造應用程式的力量,而且這種情況不會很快改變。達利歐上個接受福斯新聞前主播 Tucker Carlson 專訪時表示,儘管美國晶片效率略勝一籌,但在大規模生產半導體晶片和開發應用 AI 方法,中國比美國更有優勢。
基金
中國大陸人工智慧(AI)新創公司 DeepSeek 藉創新模式崛起,以遠低於產業龍頭 OpenAI 的開發成本,建構出效能相當的模型,標誌 AI 發展重要轉捩點。市場憧憬中國大陸 AI 公司將受惠此產業轉變,引發全球投資人對中國大陸市場的興趣。
港股
除汽車行業外,小米也在攪動家電江湖,上周四 (2 月 27 日) 發佈要跟大金空調競爭、要價人民幣 2.9 萬元的中央空調系統,小米高管更放話稱「給行業一點震撼」。去年,小米在中國的空調銷量位居第四,今年目標是成為第三名。統計數據顯示,在 2023 年 10 月至 2024 年 9 月,包含家電在內的物聯網與生活消費產品領域的營收約 930 億人民幣,是小米第二大收入源。
科技
自宇樹科技機器人在春晚爆紅及 DeepSeek 橫空出世震驚全球後,杭州一時之間成為世界目光,在這些令世界驚歎的顛覆者產品背後,都跟浙江大學這個名字緊密相連。中國《投資家》雜誌報導,作為國內最早開展機器人本科教學的高校之一,浙大早已是機器人創新創業的沃土,依靠率先發展,尤其產學研的協同,浙大跑出了一支機器人天團。
科技
中國 AI 新創公司 DeepSeek 近來「開源」一波波,上周六 (1 日) 又有更大驚喜,全面揭秘 DeepSeek-V3/R1 推理系统,不僅公開其推理系統的核心優化方案,更首次披露成本獲利率等關鍵數據,引發產業震動。DeepSeek 上周六在知乎平台發佈首條文章,公佈模型推理成本利潤細節,並披露成本獲利率關鍵資訊,若所有 tokens 全按 DeepSeek-R1 的定價計算,理論上一天的總收入為 56 萬 2027 美元,成本獲利率為 545%,這一數字刷新全球 AI 大模型領域的獲利天花板。
雜誌
文.洪寶山1990 年底香港恒生指數收在 3024 點,當時台灣加權指數收在 4530 點,相信那一年的背景很多人都知道,著名的波斯灣戰爭成為港劇《大時代》的大奇蹟日的背景,也就是說,經過那一年的股市崩盤後,加權指數還比恒生指數高了 1506 點。
港股
各家大模型紛紛推出深度思考模型之際,中國互聯網大廠騰訊 (00700-HK) 上周四 (2 月 27 日)「反常」地推出快思考模型 Turbo S,並在騰訊雲和元寶上線。目前,開發者和企業用戶可在騰訊雲上通過 API 調用騰訊混元 Turbo S,免費試用一周,開發團隊稱「比大模型界的拼多多還便宜」。
美股雷達
DeepSeek 在其開源週的最後一天,隆重推出了兩款顛覆性的資料處理工具:Fire-Flyer File System (3FS) 和 Smallpond。這兩款工具以其卓越的效能和極高的吞吐量,能夠輕鬆處理 PB 級的數據,標誌著數據處理技術的一個新里程碑。
美股雷達
在 DeepSeek 熱潮帶動下,出於性價比、合規性考慮,中國大廠對輝達(Nvidia)(NVDA-US) 「中國特供版」晶片 H20 的需求旺盛,一位受訪輝達經銷商稱 H20 已成為大廠最愛。據《財聯社》周四(27 日)報導,TrendForce 集邦咨詢分析師龔明德表示,從人工智慧(AI)伺服器市場觀察,目前中國市場主要 GPU 供應仍以 H20 等為主力。
專家觀點
【輝達財報優於預期站穩 AI 霸主地位】輝達清晨公布最新去年第四季財報,再度繳出優於市場預期數字,Q4 營收 393.31 億、每股 EPS0.89 美元都擊敗市場預期,唯一美中不足之處在於毛利率 73% 較上個季度與去年同期下滑,但亮眼的財報數字也再度證明,輝達 (NVDA-US) 仍是 AI 的霸主,輝達執行長黃仁勳也談到,市場對於 Blackwell 的需求非常驚人,光去年第四季業務收入就達到 110 億美元,而輝達也將擔任星際之門計畫的關鍵技術合作夥伴、全球 500 大最強力的超級電腦系統,也有 75% 用輝達技術。
中國 A 股三大指數周四 (27 日) 收盤表現漲跌不一,僅上證指數(SSEC) 收紅,但滬深兩市成交額重返 2 兆人民幣水位。滬指周三收紅 0.23% 報 3388.06 點,深證成指 (SZI) 收低 0.26% 至 10927.51 點,創業板指收黑 0.52% 至 2256.51 點,滬深兩市成交額人民幣 2.0046 兆元,較前一交易日的 1.9384 兆元增加 662 億元。
DeepSeek 今 (27) 日又有大動作,推出並行計算優化三劍客 DualPipe、EPLB 以及 profile-data,其中一口氣開源兩項堪稱「AI 訓練加速神器」的技術,當中還有創辦人梁文鋒親自參與的 DualPipe 專案。專家認為,這對於動輒需要數百萬美元、耗時數月的大模型訓練來說是一劑「強心針」。