開源
中國網信辦、工信部、科技部和國家知識產權局在內的八部門近日傳出正聯合起草一項重磅級政策,鼓勵在全國範圍內使用開源 RISC-V 晶片。有別於傳統的指令集,RISC-V「生而開源」,開發者可根據需要自由組合,搭建出不同的晶片。2010 年,美國柏克萊加州大學一個團隊領導研發第五代精簡指令集架構 RISC-V,並宣佈對外開源。
美股雷達
Meta (META-US) 即將推出的 Community Notes 功能在透過眾包方式監控錯誤訊息;該功能將採用馬斯克的 X 為其類似服務開發的一些技術。Meta 周四 (13 日) 在一篇部落格文章中透露了其新內容審核工具的更多細節,並表示它採用與 X 的 Community Notes 相同的開源演算法。
硅基智能旗下數位人模型 HeyGem.ai 在 GitHub 開源僅 3 天即突破 1,300 顆 Star,不只凸顯 Heygem.ai 的技術領先性,更顯示全球開發者對開源生態的高度認可與對數位人類技術普及化的深切期待。在 Heygem.ai 開源專案的 GitHub Issues 中,68% 的開發者表示,「超快速克隆、100% 口型精準匹配」是他們首選 Heygem.ai 的核心原因,超過 30% 的開發者集中討論 Heygem.ai 與其他人工智慧模型融合,實現「文字 - 數位視訊場景 - 生產」全路人視訊場景 - 生產。
A股港股
DeepSeek 上周展開為期 5 天的程式碼開源周,開源內容包括 FlashMLA、DeepEP、DeepGEMM 等程式碼庫,以及優化並行策略 DualPipe、EPLB,訓練和推理框架分析數據,以及 Fire-Flyer 文件系統 (3FS)。
美股雷達
DeepSeek 在其開源週的最後一天,隆重推出了兩款顛覆性的資料處理工具:Fire-Flyer File System (3FS) 和 Smallpond。這兩款工具以其卓越的效能和極高的吞吐量,能夠輕鬆處理 PB 級的數據,標誌著數據處理技術的一個新里程碑。
美股雷達
DeepSeek-R1 今年 1 月橫空出世後,輝達 (NVDA-US) 首份財報終於出爐。這是份看似亮眼的財報:截至今年 1 月底的財年第四財季營收 393 億美元,年增 78%,淨利 220 億美元,年增 80%,均超市場預期。然而,營收成長連續第四個季下滑及核心業務資料中心營收的年增幅創下近四個季最低,也凸顯出輝達面臨的壓力。
美股雷達
近日,輝達 (NVDA-US) 開源了首個在 Blackwell 架構上優化的 DeepSeek-R1,實現了推理速度提升 25 倍,並且每 token 成本降低 20 倍的驚人成果。這一新模型的推出,標誌著輝達在人工智慧領域的又一次重大進展。
近來,「杭州六小龍」成為中國資本市場關注熱點,其中包括 DeepSeek、宇樹科技、遊戲科學、雲深處科技、強腦科技和群核科技,而杭州六小龍一片風光的同時,昔日的大模型「六小龍」卻正在快速掉隊。中國財經新媒體《礪石商業評論》報導,和 DeepSeek 同期發佈的 Kimi 全球強化學習模型 k1.5、階躍推理模型 Step R-mini,在模型能力上諸多層面接近 o1,但仍淹沒在 DeepSeek 火爆的輿論中,且跟 DeepSeek 的喧鬧相比,「六小龍」也接二連三爆出壞消息,先是零一萬物進一步拆分,後又發生月之暗面預算和仲裁案未和解以及 MiniMax 又一高管離職。
美股雷達
本星期是中國 AI 新創公司 DeepSeek 的開源周,DeepSeek 則在第三天,發佈了 DeepGEMM,是一個支援稠密和 MoE 模型的 FP8 GEMM(通用矩陣乘法) 計算庫,僅憑 300 行代碼就超過專家優化的內核,可為 V3/R1 的訓練和推理提供強大支援,更令人興奮的是,DeepSeek-R2 有望在 5 月前提前發佈。
阿里巴巴 (09988-HK)(BABA-US) 也加入視頻大模型開源之爭,周二 (25 日) 晚間宣佈全面開源旗下視頻生成模型通義萬相 2.1,此次開源採用 Apache2.0 協定,14B 和 1.3B 兩個參數規格的全部推理代碼和權重全部開源,同時支援文生視頻和圖生視頻任務,全球開發者可在 Github、HuggingFace、魔搭社區下載體驗。
A股港股
DeepSeek 開源第二天,他們一大早在官推上發佈消息,開源 DeepEP。DeepEP 是一個專為混合專家 (MoE) 模型訓練和推理設計的開源 EP(專家並行) 通訊庫。此舉迅速在 AI 社群引起廣泛關注,不到一小時,DeepEP 在 GitHub 上的 Star 數就已破千。
科技
DeepSeek 周一 (24 日) 正式啟動「開源周」,首發程式碼庫 FlashMLA,立刻在業界引發了廣泛關注。社群媒體上,網友紛紛留言表示期待,稱讚 DeepSeek 是「真正的 OpenAI」。FlashMLA 是什麼?FlashMLA 是一個針對 Hopper GPU 優化的高效 MLA (Multi-Head Latent Attention) 解碼內核,專為處理可變長度序列而設計,目前已投入生產使用。
大陸政經
中國深圳市政府周日 (23 日) 舉行一場名為「打造最好科技創新生態和人才發展環境」記者會,打出「組合拳」營造科技創新生態,將探索實施「開源合夥人」支持計畫,最高支持 3 千萬人民幣,打造科創開源之城。《深圳衛視》報導,中共深圳市委科技創新委員會辦公室主任、市科技創新局局長張林在會上分 11 個方面打造深圳科創新生態有關情況進行介紹。
A股港股
人工智慧公司 DeepSeek 近日宣布,將於下周啟動「開源周」活動,陸續開源五個程式碼庫,以完全透明的方式分享其在通用人工智慧(AGI)領域的研發進展。此舉不僅展現了 DeepSeek 對開源社群的承諾,更預期將為 AGI 的發展注入新的活力。
科技
馬斯克周二 (18 日) 發表 Grok-3,號稱「地球上最聰明 AI」,而近期爆紅的 DeepSeek 也沒閒著,在當天發表名為《Native Sparse Attention: Hardware-Aligned and Natively Trainable Sparse Attention》的一項重要論文,介紹一種新的稀疏注意力機制(Natively Sparse Attention,NSA),用於提升長文本訓練和推理的效率,並具備硬體對齊和端到端訓練的特性。
A股港股
DeepSeek 概念熱度持續攀升,港股騰訊 (00700-HK) 成為最新的受惠股,周一 (17 日) 盤中大漲超過 5%。消息面上,微信啓動 DeepSeek-R1 大模型灰度測試的消息引發資本市場高度關注。微信作爲騰訊的核心流量入口,在其搜索欄新增了「AI 搜索」功能,用戶能夠調用 DeepSeek-R1 實現快速問答與深度思考。
港股
中國互聯網巨頭百度 (09888-HK)(BIDU-US) 上周四 (13 日) 宣佈旗下聊天機器人「文心一言」自 4 月 1 日起免費,隔天又宣佈文心大模型 4.5 系列陸續推出,從 6 月 30 日起正式開源,專家認為百度從閉源模型和收費服務的擁護者,一夕之間變為開源玩家,顯示大模型正式進入「開源盛世」。
港股
阿里巴巴 (09988-HK)(BABA-US)共同創辦人兼董事會主席蔡崇信周四 (13 日) 在世界政府峰會上表示,領先的 AI 模型不斷變化,新模型迅速超越舊模型,是一場持續的競賽。他並對跟蘋果(AAPL-US) 合作的傳聞回應稱「他們很挑剔,我們很幸運」。
科技
最新數據顯示,近來紅遍海內外的中國開源 AI 工具 DeepSeek 網站用戶數量超過谷歌 (GOOGL-US) 聊天機器人 Gemini,此前 DeepSeek 在美國的訪問量也在上周二 (1 月 28 日) 達到創紀錄的 4900 萬次,比前一周暴增 614%,成為全球第二受歡迎的 AI 聊天機器人。
科技
中國開源 AI 公司 DeepSeek 引爆新一輪 AI 熱潮,但最新數據顯示,去年中國 AI 融資規模遠不及美國。去年全球 AI 領域投、融資活動數量年增 6.35% 至 4505 件,融資年增 79.61% 至 1004 億美元 (約 3.33 兆台幣),但去年中國 AI 新創企業僅籌到 52 億美元 (約 1723 億台幣),僅占美國 AI 新創企業籌得的 763 億美元的 7%。