DeepSeek
美股雷達
騰訊為與國際接軌,挑在周五 (21 日) 深夜正式發表了混元大模型系列的深度思考模型-混元 T1 正式版,為騰訊自研的強推理模型,吐字速度達到 60~80token/s,實際生成效果顯著優於 DeepSeek-R1。混元 T1 的前身是今年 2 月中旬在騰訊元寶 APP 上線的混元 T1-Preview 推理模型,而此次正式版則基於騰訊混元 3 月初發布的業界首個超大規模 Hybrid-Transformer-Mamba MoE 大模型 TurboS 快思考基座。
專家觀點
【週 K 終結連三黑、月底前還有機會?】雖週五再度下跌 168 點、不過本週週 K 是以上漲 241 點的紅 K 作收,終結了週 K 的連三黑,而在本週有一個比較好的現象就是都有利空築底的現象,如美國在週四凌晨的利率決策會議,下修經濟成長率、上調失業率與通膨率,且並沒有增加今年可能多降息的預期,但四大指數卻是連兩根紅 K 棒,只要今天三巫日沒有進一步下殺,短線就有利空築底的機會,而對於台股也是如此,今天沙盤的過程當中,整體並沒有太大的成交量,最後一盤才因為富時指數成分股調整爆出了 886 億的大量,比平常多出約 600 億的成交量,不過若不考慮這個因素,今天下跌也是呈現量縮,整體殺盤的力道並不強。
據《每日經濟新聞》周四(20 日)報導,零一萬物創始人李開復在一檔對話節目時表示,DeepSeek 掀起的行業變革徹底顛覆人工智慧(AI)行業的發展模式,「可能讓 OpenAI 創始人輾轉難眠」。他同時預測,中國市場最終可能只剩下 DeepSeek、阿里巴巴 (09988-HK)(BABA-US) 和字節跳動三家主要 AI 模型公司,目前 DeepSeek 的勢頭最強。
AI 晶片巨擘輝達 (NVDA-US) 周二 (18 日) 舉行年度 AI 盛宴 GTC 大會,執行長黃仁勳激情演講約兩個小時,描繪輝達的未來藍圖,但資本市場對這種熱情並不很買單,周二股價收低 3.43% 至每股 115.43 美元,盤後再下跌 0.55% 至 114.79 美元。
美國商務部長 Howard Lutnick 周二 (18 日) 表示,川普政府正尋求企業和外國政府的幫助,以防止中國獲得美國晶片,並重申他認為中國 AI 新創公司 DeepSeek 不當使用了美國晶片,還警告美國若失去台灣晶片將無法製造汽車。
DeepSeek 之所以爆火,是因為它憑藉不高的算力,就能提供媲美主流大模型的性能,谷歌 (GOOGL-US) 上週三推出能單晶片運作的最新版 Gemma 大型模型「Gemma 3」,標誌著其在人工智慧開發上的重大進展。Gemma 的初代版本於一年前問世,這款基於開源 AI 模型的產品顯示了谷歌放棄僅依賴自身專有技術的決策。
根據彭博行業研究 (Bloomberg Intelligence) 的報告, 到 2025 年,全球最大的科技公司將大幅提高對人工智慧 (AI) 的年度支出,預計將超過 5,000 億美元,並預示著未來十年內 AI 領域將進入新的高成長階段。
中國網信辦、工信部、科技部和國家知識產權局在內的八部門近日傳出正聯合起草一項重磅級政策,鼓勵在全國範圍內使用開源 RISC-V 晶片。有別於傳統的指令集,RISC-V「生而開源」,開發者可根據需要自由組合,搭建出不同的晶片。2010 年,美國柏克萊加州大學一個團隊領導研發第五代精簡指令集架構 RISC-V,並宣佈對外開源。
中國 AI 新創公司 Monica 共同創辦人、首席科學家季逸超 (Peak) 周一 (10 日) 在社群平台透露,Manus 使用了 Claude 大模型和不同的阿里千問 (Qwen) 大模型的微調模型開發。Claude 是美國 AI 新創公司 Anthropic 發佈的大語言模型家族,擁有高級推理、視覺分析、代碼生成、多語言處理、多模態等能力。
台股新聞
人工智慧 (AI) 技術進入高速發展階段,從生成式 AI 到自動駕駛、醫療影像分析等應用場景,全球對於算力的需求正以指數級增長。輝達執行長黃仁勳指出,新一代 AI 模型所需的算力比早期 ChatGPT 時代高出百倍,次世代 AI 演算法所需的算力可能是當前的數百萬倍,在這樣的背景下,EDA(電子設計自動化)與 ASIC(應用專用積體電路)技術成為加速 AI 發展的關鍵,也讓台灣矽智財相關企業站上了全球半導體供應鏈的戰略高地。
美股雷達
一位知情人士週五 (7 日) 表示,基於擔憂國家安全,川普政府正考慮禁止在政府公用設備上使用中國 AI 新創公司 DeepSeek 的聊天機器人。《華爾街日報》週五率先報導,美國官員對 DeepSeek 對用戶資料的處理方式感到擔憂,DeepSeek 將用戶資料儲存在位於中國伺服器中。
中國科技巨頭今年強勁反彈,市值總計飆升 4390 億美元,讓曾經不可戰勝的美國同行望塵莫及。許多投資者表示,這種情況還會進一步持續。法國興業銀行將阿里巴巴 (09988-HK)(BABA-US) 及騰訊 (00700-HK) 等七家中國科技龍頭企業,組成「中國七雄」等權重指數,今年已上漲超過 40%。
阿里巴巴 (09988-HK)(BABA-US)Qwen 團隊周三 (5 日) 晚間發文宣佈最新研究成果 QwQ-32B 大語言模型,在僅有 DeepSeek-R1 約二十分之一參數量的情況下,用強化學習 (RL) 實現性能上的驚人跨越。Qwen 團隊在部落格文章中提到,他們深入探索 RL 在提升大語言模型智慧方面的巨大潛力,QwQ-32B 的成功發佈,有力地證明 RL 是提升模型性能的強大引擎。
A股
中國目前唯一採用全國產算力訓練的深度推理大模型星火 X1 周一 (3 日) 全面升級,單機部署成本驟降,徹底顛覆行業應用門檻。中國 AI 媒體《新智元》報導,時隔一個半月,科大訊飛 (002230-CN) 的星火 X1 在數學能力上大幅躍升,僅以 70B 參數規模,便追平 ChatGPT o1 和 DeepSeek-R1,尤其是在競賽級難題上再攀高峰,在中小學實用任務,更是全面領先 DeepSeek-R1。
科技
中國 DeepSeek R1 模型發佈以來,成爲改變整個行業格局的催化劑,根據瑞銀 (UBS-US) 近日對 20 家軟體公司進行的調查,企業客戶日益傾向利用 AI 作為生產力和收入成長的驅動力,因 DeepSeek R1 使成本下降。DeepSeek R1 是一個強大的開源推理模型,其 API 成本為每 100 萬 tokens 人民幣 16 元,對企業來說較為實惠。
科技
橋水基金創始人達利歐上月在最新表示,美國可能在 AI 晶片開發上暫時領先,但中國將繼續擁有為這些晶片製造應用程式的力量,而且這種情況不會很快改變。達利歐上個接受福斯新聞前主播 Tucker Carlson 專訪時表示,儘管美國晶片效率略勝一籌,但在大規模生產半導體晶片和開發應用 AI 方法,中國比美國更有優勢。
基金
中國大陸人工智慧(AI)新創公司 DeepSeek 藉創新模式崛起,以遠低於產業龍頭 OpenAI 的開發成本,建構出效能相當的模型,標誌 AI 發展重要轉捩點。市場憧憬中國大陸 AI 公司將受惠此產業轉變,引發全球投資人對中國大陸市場的興趣。
港股
除汽車行業外,小米也在攪動家電江湖,上周四 (2 月 27 日) 發佈要跟大金空調競爭、要價人民幣 2.9 萬元的中央空調系統,小米高管更放話稱「給行業一點震撼」。去年,小米在中國的空調銷量位居第四,今年目標是成為第三名。統計數據顯示,在 2023 年 10 月至 2024 年 9 月,包含家電在內的物聯網與生活消費產品領域的營收約 930 億人民幣,是小米第二大收入源。
科技
自宇樹科技機器人在春晚爆紅及 DeepSeek 橫空出世震驚全球後,杭州一時之間成為世界目光,在這些令世界驚歎的顛覆者產品背後,都跟浙江大學這個名字緊密相連。中國《投資家》雜誌報導,作為國內最早開展機器人本科教學的高校之一,浙大早已是機器人創新創業的沃土,依靠率先發展,尤其產學研的協同,浙大跑出了一支機器人天團。
科技
中國 AI 新創公司 DeepSeek 近來「開源」一波波,上周六 (1 日) 又有更大驚喜,全面揭秘 DeepSeek-V3/R1 推理系统,不僅公開其推理系統的核心優化方案,更首次披露成本獲利率等關鍵數據,引發產業震動。DeepSeek 上周六在知乎平台發佈首條文章,公佈模型推理成本利潤細節,並披露成本獲利率關鍵資訊,若所有 tokens 全按 DeepSeek-R1 的定價計算,理論上一天的總收入為 56 萬 2027 美元,成本獲利率為 545%,這一數字刷新全球 AI 大模型領域的獲利天花板。