開源
輝達 (NVDA-US) 今 (8) 日突然開源了一款名為 Llama-3.1-Nemotron-Ultra-253B-v1 的新模型,性能逼近擁有 6710 億參數的 DeepSeek R1,但只用了不到一半的參數量。該模型基於 Meta 早期的 Llama-3.1-405B-Instruct 模型開發,擁有 2530 億個參數,在第三方實證基準測試中表現出色。
史丹佛大學以人為本 AI 研究院 (HAI) 發表長達 456 頁的《AI 指數報告 2025》,全面介紹了中美 AI 競爭態勢、開源模型等當前人工智慧發展趨勢,其中 DeepSeek 被提及 45 次。報告強調,AI 技術在多個領域展現出驚人的進步,同時也面臨著新的挑戰與機遇。
美股雷達
開源王座一夜易主!Meta(META-US) 發布了其最新的開源大型語言模型 Llama 4,首次採用 MoE 混合專家架構,支援多達 12 種語言。新系列具備業界領先的長文本處理能力與圖文整合效能,開放權重模型即日起可於 llama.com 與 Hugging Face 平台下載,並已整合至 WhatsApp、Messenger 與 Instagram Direct 等 Meta 旗下產品。
美股雷達
OpenAI 正值創紀錄的 400 億美元融資、3000 億美元估值的巔峰時刻,卻決定放棄自 2019 年以來堅持的封閉模式策略,這項看似矛盾的決策背後有多重複雜且深刻的原因,包括來自中國 DeepSeek 的競爭壓力、AI 價值重心的轉移、企業對靈活性的需求,以及與 Meta 在開源領域的潛在競爭。
美股雷達
OpenAI 最近宣布重磅消息,計劃未來幾個月內發布一款強大的開放權重模型。這是自 2019 年 GPT-2 以來,OpenAI 首次開放權重語言模型,標誌著其回歸開源的初心。模型的「權重」指的是大型神經網路內部的值,這些值在訓練過程中設定。
科技
國際權威人工智慧分析平台 aitools.xyz 最新數據顯示,今年 2 月中國 AI 新創公司 DeepSeek 實現歷史性突破——當月新增網站訪問量達 5.247 億次,超越 OpenAI 旗下 ChatGPT 的 5 億次,登頂全球 AI 工具單月訪問量榜首。
科技
智譜 AI 今 (31) 日在 2025 年中關村論壇上,正式推出自主研發的智能體產品 AutoGLM 沉思,該產品集深度研究與操作執行於一體,能像人類一樣自主完成從資料檢索、分析到報告產生的完整流程。透過整合全端自研模型 GLM-Z1-Air 和智能體技術架構 AutoGLM,AutoGLM 沉思實現每秒 200token 的高速生成能力,但性能對標 DeepSeek-R1 卻只需其 1/30 的成本。
美股雷達
全球最大的行動作業系統 Android 即將迎來一項重大變革。Google(GOOGL-US) 已證實,未來 Android 作業系統的開發工作將全面在 Google 的內部進行,不再像過去一樣,部分程式碼會在公開的 Android 開放原始碼專案 (AOSP)Gerrit 上進行。
美股雷達
全世界都錯了,Scaling Law 並沒有撞牆!輝達 (NVDA-US) 執行長黃仁勳在 GTC 大會上向全世界這樣宣布。輝達預言,未來每個擁有工廠的公司都會有兩個工廠,一個是用來製造產品的實體工廠,另一個是用於數學運算的 AI 工廠。為此,各類 CUDA-X 軟體庫已準備好引爆各產業的變革。
港股
中國網信辦、工信部、科技部和國家知識產權局在內的八部門近日傳出正聯合起草一項重磅級政策,鼓勵在全國範圍內使用開源 RISC-V 晶片。有別於傳統的指令集,RISC-V「生而開源」,開發者可根據需要自由組合,搭建出不同的晶片。2010 年,美國柏克萊加州大學一個團隊領導研發第五代精簡指令集架構 RISC-V,並宣佈對外開源。
美股雷達
Meta (META-US) 即將推出的 Community Notes 功能在透過眾包方式監控錯誤訊息;該功能將採用馬斯克的 X 為其類似服務開發的一些技術。Meta 周四 (13 日) 在一篇部落格文章中透露了其新內容審核工具的更多細節,並表示它採用與 X 的 Community Notes 相同的開源演算法。
硅基智能旗下數位人模型 HeyGem.ai 在 GitHub 開源僅 3 天即突破 1,300 顆 Star,不只凸顯 Heygem.ai 的技術領先性,更顯示全球開發者對開源生態的高度認可與對數位人類技術普及化的深切期待。在 Heygem.ai 開源專案的 GitHub Issues 中,68% 的開發者表示,「超快速克隆、100% 口型精準匹配」是他們首選 Heygem.ai 的核心原因,超過 30% 的開發者集中討論 Heygem.ai 與其他人工智慧模型融合,實現「文字 - 數位視訊場景 - 生產」全路人視訊場景 - 生產。
A股港股
DeepSeek 上周展開為期 5 天的程式碼開源周,開源內容包括 FlashMLA、DeepEP、DeepGEMM 等程式碼庫,以及優化並行策略 DualPipe、EPLB,訓練和推理框架分析數據,以及 Fire-Flyer 文件系統 (3FS)。
美股雷達
DeepSeek 在其開源週的最後一天,隆重推出了兩款顛覆性的資料處理工具:Fire-Flyer File System (3FS) 和 Smallpond。這兩款工具以其卓越的效能和極高的吞吐量,能夠輕鬆處理 PB 級的數據,標誌著數據處理技術的一個新里程碑。
美股雷達
DeepSeek-R1 今年 1 月橫空出世後,輝達 (NVDA-US) 首份財報終於出爐。這是份看似亮眼的財報:截至今年 1 月底的財年第四財季營收 393 億美元,年增 78%,淨利 220 億美元,年增 80%,均超市場預期。然而,營收成長連續第四個季下滑及核心業務資料中心營收的年增幅創下近四個季最低,也凸顯出輝達面臨的壓力。
美股雷達
近日,輝達 (NVDA-US) 開源了首個在 Blackwell 架構上優化的 DeepSeek-R1,實現了推理速度提升 25 倍,並且每 token 成本降低 20 倍的驚人成果。這一新模型的推出,標誌著輝達在人工智慧領域的又一次重大進展。
近來,「杭州六小龍」成為中國資本市場關注熱點,其中包括 DeepSeek、宇樹科技、遊戲科學、雲深處科技、強腦科技和群核科技,而杭州六小龍一片風光的同時,昔日的大模型「六小龍」卻正在快速掉隊。中國財經新媒體《礪石商業評論》報導,和 DeepSeek 同期發佈的 Kimi 全球強化學習模型 k1.5、階躍推理模型 Step R-mini,在模型能力上諸多層面接近 o1,但仍淹沒在 DeepSeek 火爆的輿論中,且跟 DeepSeek 的喧鬧相比,「六小龍」也接二連三爆出壞消息,先是零一萬物進一步拆分,後又發生月之暗面預算和仲裁案未和解以及 MiniMax 又一高管離職。
美股雷達
本星期是中國 AI 新創公司 DeepSeek 的開源周,DeepSeek 則在第三天,發佈了 DeepGEMM,是一個支援稠密和 MoE 模型的 FP8 GEMM(通用矩陣乘法) 計算庫,僅憑 300 行代碼就超過專家優化的內核,可為 V3/R1 的訓練和推理提供強大支援,更令人興奮的是,DeepSeek-R2 有望在 5 月前提前發佈。
阿里巴巴 (09988-HK)(BABA-US) 也加入視頻大模型開源之爭,周二 (25 日) 晚間宣佈全面開源旗下視頻生成模型通義萬相 2.1,此次開源採用 Apache2.0 協定,14B 和 1.3B 兩個參數規格的全部推理代碼和權重全部開源,同時支援文生視頻和圖生視頻任務,全球開發者可在 Github、HuggingFace、魔搭社區下載體驗。
A股港股
DeepSeek 開源第二天,他們一大早在官推上發佈消息,開源 DeepEP。DeepEP 是一個專為混合專家 (MoE) 模型訓練和推理設計的開源 EP(專家並行) 通訊庫。此舉迅速在 AI 社群引起廣泛關注,不到一小時,DeepEP 在 GitHub 上的 Star 數就已破千。