模型
根據《彭博》周四 (29 日) 報導,中國人工智慧 (AI) 新創公司深度求索 (DeepSeek) 宣布,其升級版模型 DeepSeek-R1-0528 在數學、程式設計與邏輯推理方面表現優於先前版本,並顯著降低模型幻覺 (Hallucination) 現象。
科技
亞馬遜 (AMZN-US) 與 Alphabet(GOOGL-US)投資的人工智慧 (AI) 新創公司 Anthropic 周四 (22 日) 正式發布旗下迄今最強的 AI 模型 Claude Opus 4 與 Claude Sonnet 4,號稱可執行長達 7 小時的程式撰寫與複雜任務,為 AI 代理人與開發者提供更高效的解決方案,也為業界樹立新標準。
A股
中國搜尋引擎巨擘百度 (BIDU-US)(09888-HK) 周三 (21 日) 公布 2025 會計年度第一季 (截至 3/31) 財報,儘管核心廣告業務仍承壓,但受惠於人工智慧 (AI) 雲端服務需求提升,總營收優於市場預期,帶動美股盤前股價一度上漲逾 2%。
美股雷達
《彭博》周二 (20 日) 援引知情人士消息報導,蘋果 (AAPL-US) 計劃在下月登場的全球開發者大會 (WWDC) 上宣布,開放自家人工智慧 (AI) 模型給第三方開發者使用,藉此促進 AI 應用程式的誕生,並進一步鞏固其在生成式 AI 領域的布局。
美股雷達
微軟 (MSFT-US) 周一 (19 日) 在年度開發者大會「Build」上宣布,將擴大其雲端人工智慧 (AI) 生態系,正式引入馬斯克旗下 xAI 的 Grok 3 和 Grok 3 mini 模型,並攜手法國新創 Mistral 及德國新創 Black Forest Labs,讓 Azure 雲端用戶可選擇超過 1,900 種 AI 模型。
台股新聞
聯發科 (2454-TW) 總經理暨營運長陳冠州出席台積電 (2330-TW)(TSM-US) 技術論壇時指出,AI 邊緣裝置的算力預計每兩年成長一倍,生成式 AI 手機的滲透率將在 2029 年超過 50%,也就是屆時每兩支手機就有一支具備 AI 能力,其中不僅 CPU、GPU 性能提升,NPU(神經網路處理器) 算力也將顯著提升。
美股雷達
華爾街主要美股預測機構在 2025 年接連受挫,許多人誤判了川普強硬貿易政策對股市的實際衝擊,因為再高明的模型也無法預測多變的川普。儘管面臨貿易戰升溫與市場劇烈波動,華爾街多數分析師仍堅信標普 500 指數將在 2025 年下半年反彈,但實際上,這種樂觀情緒已與歷史表現背道而馳。
美國史丹佛大學人本人工智慧研究中心 (HAI) 發布一年一度 AI Index 報告,內容長達 456 頁,涵蓋了過去一年全球 AI 各種進展的資訊,其中提到中國與美國模型的差距正在縮小。報告指出,2023 年,領先的美國模型表現明顯優於中國模型,但這項趨勢已不復存在。
美股雷達
根據美媒《The Information》周五 (4 日) 援引知情人是消息報導,Meta Platforms(META-US)計劃於本月發布其最新的語言模型 Llama 4,儘管該模型已經至少兩次推遲。這是 Meta 為在人工智慧 (AI) 競賽中爭奪領先地位所作的努力之一,但報導指出,Meta 可能會再次推遲 Llama 4 的發布。
美股雷達
OpenAI 執行長奧特曼 (Sam Altman) 周一 (3 月 31 日) 表示,公司計劃在未來幾個月內發布自 GPT-2 以來,首款具備推理能力的開放權重 (open-weight) 語言模型。開放權重語言模型的訓練參數 (權重) 將對外開放,開發者可以使用這些參數分析並微調模型,以適應特定任務,而無需取得原始訓練數據。
港股
阿里巴巴 (09988-HK)(BABA-US) 宣布推出一款名為 QwQ-32B 的新型 AI 模型,聲稱其僅需 DeepSeek 模型一小部分的數據,即可達到與之相當的性能,消息一出,激勵公司股價顯著上漲。報導稱,阿里巴巴於 2025 年已憑藉其高基準測試的模型在中國國內 AI 領域嶄露頭角。
A股
路透周二 (25 日) 援引知情人士消息報導,中國人工智慧 (AI) 新創公司深度求索 (DeepSeek) 原本計劃在 5 月推出新一代 AI 模型「R2」,但現在該公司希望盡快推出。據了解,新模型在寫程式和多語言推理方面的能力有所提升。DeepSeek 的成功可能會徹底改變 AI 行業。
A股港股
DeepSeek 開源第二天,他們一大早在官推上發佈消息,開源 DeepEP。DeepEP 是一個專為混合專家 (MoE) 模型訓練和推理設計的開源 EP(專家並行) 通訊庫。此舉迅速在 AI 社群引起廣泛關注,不到一小時,DeepEP 在 GitHub 上的 Star 數就已破千。
美股雷達
Anthropic 24 日發布了最新的 AI 王牌組合 Claude 3.7 Sonnet 和 Claude Code!毫不掩飾對 Claude 3.7 Sonnet 的自信,直接稱其為 「迄今為止最智慧的模型」,更重要的是,還開創性地成了「市場首個混合推理模型」。
A股港股
中國人工智慧新創公司 DeepSeek 崛起,引發全球科技界關注。DeepSeek 成立不到兩年,其估值已出現大幅飆升,市場預測最高可能超過千億美元。一些業內人士估計,這家公司的創辦人梁文鋒,也可能因此成為亞洲頂級科技富豪,其身價甚至有望超越輝達 (NVDA-US) 創辦人黃仁勳。
台股新聞
研調機構 Counterpoint 今 (12) 日指出,DeepSeek 近期推出的 R1 與 V3 大型語言模型 (LLMs) 掀起業界熱議,這兩款開源模型不僅展現卓越性能,當中即透過四項創新讓其表現突出,更在成本上具備顯著優勢,API 價格比 ChatGPT o1 低達 96%,顛覆 AI 產業過往對高效能模型須依賴巨額資金與算力堆砌的認知。
美股雷達
美媒《The Information》周二 (11 日) 援引知情人士消息報導,蘋果 (AAPL-US) 已經與中國科技巨擘阿里巴巴 (BABA-US)(09988-HK) 達成合作,計劃將人工智慧 (AI) 功能引入中國市場的 iPhone、iPad 及 Mac 產品中。
科技
根據彭博周四 (6 日) 報導,中國新創公司深度求索 (DeepSeek) 表示,由於伺服器容量不足,將限制其應用程式介面 (API) 服務的存取。該公司在其網站上發表公告,指出將暫停用戶加值 API 信用額度,避免對其服務造成更大影響,但現有的額度不會受到影響,用戶仍可繼續使用已加值的信用額度。
A股港股
字節跳動 (TikTok 的母公司) 近日推出了一款名為 OmniHuman-1 的人工智慧系統,該系統能夠僅憑一張照片生成栩栩如生的影片,影片中的人物可以說話、做手勢、唱歌、演奏樂器等等。這項技術引起了廣泛關注,並在人工智慧領域引發了關於其潛在用途和風險的討論。
美股雷達
OpenAI 執行長 Sam Altman 否認了將控告中國新創公司 DeepSeek 的計畫,儘管他們聲稱 DeepSeek「蒸餾」(distillation) 了 OpenAI 的技術。Altman 表示 OpenAI 將專注於持續開發領先的 AI 模型,而非訴訟。