大型語言模型
美媒《CNBC》周五 (14 日) 報導,隨著中國新創公司深度求索 (DeepSeek) 推出更便宜且高效的人工智慧 (AI) 模型,可能會重塑資料中心的需求,進一步促進這一已經蓬勃發展的行業。資料中心是數位轉型和大型語言模型 (LLMs) 訓練的核心基礎設施,分析師長期預測其將持續成長。
美股雷達
Alphabet 旗下的 Google 周三 (5 日) 宣布更新其 Gemini 系列的大型語言模型 (LLM),並推出一款全新的低成本人工智慧 (AI) 模型,以對抗來自中國競爭對手 DeepSeek 的低價產品。Google 現在提供多個版本的 Gemini 模型,根據價格和效能有所區別。
A股港股
人工智慧 (AI) 領域的發展日新月異,其中,大型語言模型 (LLM) 更是備受矚目。在這一領域中,一家名為 DeepSeek 的中國新創公司異軍突起,不僅在技術上取得了重大突破,更以其獨特的發展模式,引起美國矽谷的關注和震驚。據報導,訓練成本極低的「DeepSeek-V3」只用了 2048 張 H100 的 GPU 集群,且用時僅 53 天。
科技
中國雲端運算領域價格戰升溫,先前字節跳動宣布其大型語言模型 (LLM) 人工智慧 (AI) 聊天機器人「豆包」費用比市場現有產品平均價格低 99.3% 後,阿里巴巴 (BABA-US)(9988-HK)、百度 (BIDU-US)(9888-HK) 周二 (21 日) 也紛紛宣布大幅降價。
美股雷達
根據 LMSYS Chatbot Arena 最新評比,全球最強 AI 寶座近日再度換人坐,兩個月前才遭 AI 新創公司 Anthropic 旗下 Claude3 Opus 超越的 OpenAI ChatGPT,再次用實力重奪 AI 一哥地位,在最新的 AI 基準測試中,OpenAI 幾天前剛發布的 GPT-4-Turbo-2024-04-09 版本,大幅超越 Claude3 Opus。
美股雷達
根據由華裔女科學家、「AI 教母」李飛飛共同領導的史丹佛大學以人為本人工智慧研究所 (HAI) 近來發佈的《2024 年人工智慧指數報告》,美國在 AI 開發上領先全球,但中國在專利數量、機器人領域居全球之冠。這份長達 501 頁的報告追蹤了 2023 年全球 AI 發展趨勢,官方稱其是 HAI 迄今發布的最全面報告,該研究所今年擴大研究範圍,更廣泛地涵蓋基本趨勢,如 AI 技術進步、民眾對 AI 看法及圍繞 AI 發展的地緣政治動態,今年的版本在內容、規模和範圍上都超過往年,反映 AI 在人類日常生活中日益增長的重要性。
台股新聞
〈聯發科達哥、MR BreeXe 提升台灣軟實力〉IC 設計龍頭大廠聯發科 4 月 9 日舉行生成式 AI 論壇,推出了生成式 AI 服務平台「MediaTek DaVinci」,亦稱「達哥」,同時也發表了由輝達在台灣建置的超級電腦 Taipei-1 所訓練、號稱「繁中最強」的最新大型語言模型 (LLM)「MediaTek Research BreeXe」,簡稱 MR BreeXe。
台股新聞
墨石資本(Inkstone Capital)旗下一家專注於人工智能研究與應用的創新企業,近日宣布其自主研發的語言大模型——玉山 AI(Yushan AI)單機 Beta 版正式推出。YuShan AI 是台灣首個由民間自主研發的大型語言模型(LLM),可在完全無網絡環境下運行於 iPad、筆記型電腦以及 Apple 和 Android 移動設備,此項技術突破不僅為 AI 技術的應用提供了新的維度,同時也為企業資訊安全提供了堅固的保障。
美股雷達
Alphabet(GOOGL-US)旗下 Google 周三 (21 日) 推出新的開放大型語言模型 (LLM)「Gemma」,外部研發人員可以將其設計成自己的模型,扭轉將公司轉有人工智慧(AI) 擋在公眾視野之外的整體策略,此前臉書母公司 Meta Platforms(META-US)也採取類似措施。