menu-icon
anue logo
熱門時事鉅亨號鉅亨買幣
search icon

大模型





    2025-03-19
  • AI 晶片巨擘輝達 (NVDA-US) 周二 (18 日) 舉行年度 AI 盛宴 GTC 大會,執行長黃仁勳激情演講約兩個小時,描繪輝達的未來藍圖,但資本市場對這種熱情並不很買單,周二股價收低 3.43% 至每股 115.43 美元,盤後再下跌 0.55% 至 114.79 美元。






  • 2025-03-10
  • 谷歌 (GOOGL-US) 大模型核心成員又出走創業。兩名前 DeepMind 頂級研究員宣布,成立一家名為 Reflection AI 的公司,旨在開發超級智慧。這家新公司甫成立,就獲得​​1.3 億美元融資,估值高達 5.55 億美元。兩位創辦人皆大有來頭。






  • 科技

    不久前,OpenAI、Anthropic 這樣的 AI 大廠還備受投資人追捧,每年投入數十億美元打造先進的大語言模型 (LLM),但近來矽谷投資風向改變,轉而追捧 AI 智能體 (AI Agent),曾經被瞧不起的 AI 應用公司,如今成了矽谷投資圈的當紅炸子雞。






  • 2025-03-05
  • A股港股

    MWC 2025 期間,華為高層指出,過去 8 個月中國市場因 AI 產生的 Token 所帶來的流量已驚人成長 33 倍,其中付費 Token 貢獻了 15 倍的增長。 華為董事、ICT BG CEO 楊超斌於會中表示,自 DeepSeek 推出後,中國市場每 Token 的價格大幅下降了 97%。






  • 2025-03-03
  • 美股雷達

    OpenAI 推出旗艦大語言模型 GPT-4.5 研究預覽版,是該公司目前為止最大、最貴的版本,具備更強大的對話能力,但卻未見到決定性的優勢,讓市場難掩失望。OpenAI 稱 GPT-4.5 為知識最淵博的模型,撰寫能力更好、有更豐富的世界知識、而且比前代模型「有更鮮明的個性」,但但也警告 GPT- 4.5 並非前端模型,也可能效能不如 o1 或 o3-mini 。






  • 科技

    中國 AI 新創公司 DeepSeek 近來「開源」一波波,上周六 (1 日) 又有更大驚喜,全面揭秘 DeepSeek-V3/R1 推理系统,不僅公開其推理系統的核心優化方案,更首次披露成本獲利率等關鍵數據,引發產業震動。DeepSeek 上周六在知乎平台發佈首條文章,公佈模型推理成本利潤細節,並披露成本獲利率關鍵資訊,若所有 tokens 全按 DeepSeek-R1 的定價計算,理論上一天的總收入為 56 萬 2027 美元,成本獲利率為 545%,這一數字刷新全球 AI 大模型領域的獲利天花板。






  • 2025-02-27
  • 港股

    騰訊 (00700-HK) 周四 (27 日) 正式推出自研快思考模式混元 Turbo S,宣稱是人工智慧領域在反應速度與性價比方面取得重大突破。這款新一代旗艦模型透過架構創新實現「秒級響應」,即日起向開發者和企業用戶開放 API 免費試用,並將逐步集成至騰訊元寶 AI 助手。






  • DeepSeek 今 (27) 日又有大動作,推出並行計算優化三劍客 DualPipe、EPLB 以及 profile-data,其中一口氣開源兩項堪稱「AI 訓練加速神器」的技術,當中還有創辦人梁文鋒親自參與的 DualPipe 專案。專家認為,這對於動輒需要數百萬美元、耗時數月的大模型訓練來說是一劑「強心針」。






  • 2025-02-26
  • 近來,「杭州六小龍」成為中國資本市場關注熱點,其中包括 DeepSeek、宇樹科技、遊戲科學、雲深處科技、強腦科技和群核科技,而杭州六小龍一片風光的同時,昔日的大模型「六小龍」卻正在快速掉隊。中國財經新媒體《礪石商業評論》報導,和 DeepSeek 同期發佈的 Kimi 全球強化學習模型 k1.5、階躍推理模型 Step R-mini,在模型能力上諸多層面接近 o1,但仍淹沒在 DeepSeek 火爆的輿論中,且跟 DeepSeek 的喧鬧相比,「六小龍」也接二連三爆出壞消息,先是零一萬物進一步拆分,後又發生月之暗面預算和仲裁案未和解以及 MiniMax 又一高管離職。






  • 美股雷達

    本星期是中國 AI 新創公司 DeepSeek 的開源周,DeepSeek 則在第三天,發佈了 DeepGEMM,是一個支援稠密和 MoE 模型的 FP8 GEMM(通用矩陣乘法) 計算庫,僅憑 300 行代碼就超過專家優化的內核,可為 V3/R1 的訓練和推理提供強大支援,更令人興奮的是,DeepSeek-R2 有望在 5 月前提前發佈。






  • 阿里巴巴周二 (25 日) 全面開源視頻生成模型萬相 2.1,共兩個參數規模,140 億參數模型適用於對生成效果要求更高的專業人士,13 億參數模型生成速度較快且能相容所有消費級 GPU,專家則指出萬相 2.1 共有五大優勢。首先,在 SOTA 性能方面,萬相 2.1 在多個基準測試中優於現有的開源模型和商業解決方案,140 億參數專業版萬相模型在權威評測集 VBench 中以總分 86.22% 大幅超越 Sora、Luma、Pika 等國內外模型,居於榜首。






  • 阿里巴巴 (09988-HK)(BABA-US) 也加入視頻大模型開源之爭,周二 (25 日) 晚間宣佈全面開源旗下視頻生成模型通義萬相 2.1,此次開源採用 Apache2.0 協定,14B 和 1.3B 兩個參數規格的全部推理代碼和權重全部開源,同時支援文生視頻和圖生視頻任務,全球開發者可在 Github、HuggingFace、魔搭社區下載體驗。






  • 2025-02-24
  • 科技

    在 AI 領域蓬勃發展的當下,人才成為各企業競爭的關鍵資源,谷歌 (GOOGL-US)17 年老將,DeepMind 研究副總裁、Google Fellow 吳永輝最新傳出正式加盟字節跳動大模型團隊 Seed,專注於大模型基礎研究搜索、AI for Science 科研工作,直接向執行長梁汝波彙報。






  • 科技

    最新數據顯示,騰訊 (00700-HK) 元寶上周六 (22 日) 在中國的下載量突然超越豆包,升至中國區蘋果(AAPL-US) 免費 APP 下載排行榜第二,DeepSeek 則繼續位居榜首。騰訊元寶自 2 月 13 日宣布同時支援混元和 DeepSeek 兩大模型後,在一周內進行多次重大更新。






  • 科技

    接不接入 DeepSeek 正成為騰訊 (00700-HK) 、百度 (09888-HK) 、阿里巴巴 (09988-HK) 、字節跳動等大廠決策高層面臨的新問題,而是要業務端產品還是自家大模型也一起接入 DeepSeek,抑或是雲端業務還是主營業務接入,這些大廠們迄今還沒有一個標準答案。






  • 科技

    自 DeepSeek 發佈後,從輝達、亞馬遜、微軟再到中國國內的百度、阿里巴巴、騰訊、華為,甚至國央企都紛紛接入 DeepSeek,OpenAI、馬斯克的 Grok 也迅速跟進,中國專家最新表示,DeepSeek 作為業內新興力量,其發展與突破極具研究與討論價值,且重新定義人類所有電子產品,未來機器人數量恐超過人類。






  • 2025-02-21
  • 科技

    繼微信接入 DeepSeek 後,騰訊控股 (00700-HK) 今 (21) 日在 AI 佈局上又做出一次重大升級,企業微信發佈多項深度接入 DeepSeek 的 AI 功能,上線功能包括智能機器人、客戶跟進總結、數據與智慧專區等,在企業微信均可免費使用,至此騰訊 ToB ToC 業務全面擁抱 AI,專家則認為騰訊近來積極布局 AI,是因為被 DeepSeek 喚醒。






  • 2025-02-20
  • 科技

    馬斯克周二 (18 日) 發表 Grok-3,號稱「地球上最聰明 AI」,而近期爆紅的 DeepSeek 也沒閒著,在當天發表名為《Native Sparse Attention: Hardware-Aligned and Natively Trainable Sparse Attention》的一項重要論文,介紹一種新的稀疏注意力機制(Natively Sparse Attention,NSA),用於提升長文本訓練和推理的效率,並具備硬體對齊和端到端訓練的特性。






  • 2025-02-18
  • 美股雷達

    美國 AI 新創公司 xAI 在美國太平洋時間周一 (17 日) 晚上正式發佈號稱「地球上最聰明 AI」Grok-3,xAI 團隊介紹,Grok-3 的性能比 Grok-2 提升了一個數量級,和 Grok-3 聊天會覺得非常有趣。xAI 團隊在直播中指出,Grok-3 和 Grok-3 mini 在多方面的測試得分上都超過或媲美 Gemini 和 ChatGPT 等對手。






  • 港股

    中國互聯網巨頭騰訊 (00700-HK)AI 助手騰訊元寶周一 (17 日) 再次迎來重大更新,混元 + DeepSeek 兩大模型均支援深度思考功能,用戶下載並打開騰訊元寶即可免費使用。騰訊自研的混元 T1 深度思考模型也在騰訊元寶開啟小範圍灰測,用戶可以自行選用。