大型語言模型
美股雷達
路透周二 (11 日) 援引兩名知情人士消息報導,臉書母公司 Meta Platforms(META-US) 正在測試與台積電 (2330-TW)(TSM-US) 合作生產的自研人工智慧 (AI) 訓練晶片,目的是要降低對輝達 (NVDA-US) 的依賴、減少基礎設施成本。
科技
美媒《CNBC》周五 (14 日) 報導,隨著中國新創公司深度求索 (DeepSeek) 推出更便宜且高效的人工智慧 (AI) 模型,可能會重塑資料中心的需求,進一步促進這一已經蓬勃發展的行業。資料中心是數位轉型和大型語言模型 (LLMs) 訓練的核心基礎設施,分析師長期預測其將持續成長。
美股雷達
Alphabet 旗下的 Google 周三 (5 日) 宣布更新其 Gemini 系列的大型語言模型 (LLM),並推出一款全新的低成本人工智慧 (AI) 模型,以對抗來自中國競爭對手 DeepSeek 的低價產品。Google 現在提供多個版本的 Gemini 模型,根據價格和效能有所區別。
A股港股
人工智慧 (AI) 領域的發展日新月異,其中,大型語言模型 (LLM) 更是備受矚目。在這一領域中,一家名為 DeepSeek 的中國新創公司異軍突起,不僅在技術上取得了重大突破,更以其獨特的發展模式,引起美國矽谷的關注和震驚。據報導,訓練成本極低的「DeepSeek-V3」只用了 2048 張 H100 的 GPU 集群,且用時僅 53 天。
2025-03-11
2025-02-15
2025-02-06
2025-01-24