大模型

‌

我的新聞

‌
‌

‌

2025-05-16

05-16
梁文鋒新論文公開降本秘訣！V3模型以50%成本解鎖大模型訓練新紀元六招破算力瓶頸
中國 AI 獨角獸企業 DeepSeek 團隊周三 (14 日) 發布具有里程碑意義的論文，揭示其最新大模型 DeepSeek-V3 的核心技術革新，創辦人兼執行長梁文鋒也是署名作者之一。該模型在硬體架構和模型設計方面的關鍵創新，為實現具有成本效益的大規模訓練和推理提供思路。
‌
‌
‌
‌
‌

2025-05-12

05-12
騰訊在AI領域下猛藥重構大模型「混元」研發體系
騰訊 (00700-HK) 正進行一場深刻的 AI 戰略調整，核心是重構其大模型「混元」的研發體系。面對國內外科技巨頭在大模型領域的激烈競爭，騰訊不僅加大研發投入，更是在組織架構、產品佈局和市場策略上多方面出擊，力求在大模型時代佔據一席之地。
‌
‌
‌
‌
‌

2025-04-29

04-29A股港股
阿里發布Qwen3系列大模型中美AI競爭持續升溫
阿里巴巴 (09988-HK)(BABA-US) 集團宣布推出新一代大模型 Qwen3 系列，涵蓋 6 億至 2350 億參數規模，成為目前中國參數規模最大的開源模式之一。模型採用混合專家（MoE）架構，在多項基準測試中表現突出，引發產業關注。
‌
‌
‌
‌
‌

2025-04-28

04-28科技
川普半導體關稅恐引爆全球IT大地震！IDC：今年全球IT支出成長率將驟降至5%
國際數據公司 (IDC) 最新預測，全球 IT 市場正面臨地緣政策與技術變革的雙重衝擊，全球今年 IT 支出成長率預估從 10% 驟降至 5%，規模縮水約 2000 億美元，半導體市場成長率也可能從 11% 放緩至 9%。這項改變主要因為美國川普政府關稅政策產生的連鎖效應，而與此形成鮮明對比的是，中國 IT 服務市場在政策與技術創新雙重驅動下保持韌性。
‌
‌
‌
‌
‌

2025-04-17

04-17A股港股
2025年世界網路大會亞太峰會：聚焦人工智能大模型
據港媒報導，2025 年世界互聯網大會亞太峰會於 4 月 15 日在香港成功舉行並圓滿落幕。本次峰會由世界互聯網大會主辦，香港特別行政區政府承辦，香港特別行政區政府創新科技及工業局協辦，香港貿易發展局及鳳凰衛視集團提供支持。這不僅是世界互聯網大會從一年一度的烏鎮峰會到首屆亞太峰會的地理空間延伸，更標誌著中國數字技術發展與數字治理影響力的進一步提升。
‌
‌
‌
‌
‌

2025-04-15

04-15香港政經
2025世界互聯網大會亞太峰會在港召開聚焦數智融合與全球合作
為期兩天的 2025 年世界網路大會亞太峰會周一 (14 日) 在香港會議展覽中心拉開序幕，近千名來自全球政商界、國際組織、科技企業及學術界的代表齊聚一堂，圍繞著「數智融合引領未來－攜手建構網路空間命運共同體」主題展開深入探討。香港特區行政長官李家超在開幕致詞中強調，香港將充分發揮「一國兩制」優勢，以自由貿易和多邊主義為根基，深化國際創科合作，助力全球數位經濟高品質發展。
‌
‌
‌
‌
‌

2025-03-19

03-19美股雷達
GTC大會後輝達股價為何下跌？分析師：黃仁勳老調重彈主題演說沒新意
AI 晶片巨擘輝達 (NVDA-US) 周二 (18 日) 舉行年度 AI 盛宴 GTC 大會，執行長黃仁勳激情演講約兩個小時，描繪輝達的未來藍圖，但資本市場對這種熱情並不很買單，周二股價收低 3.43% 至每股 115.43 美元，盤後再下跌 0.55% 至 114.79 美元。
‌
‌
‌
‌
‌

2025-03-10

03-10
谷歌人才又出走！DeepMind核心成員自立門戶開發「超級智慧」
谷歌 (GOOGL-US) 大模型核心成員又出走創業。兩名前 DeepMind 頂級研究員宣布，成立一家名為 Reflection AI 的公司，旨在開發超級智慧。這家新公司甫成立，就獲得1.3 億美元融資，估值高達 5.55 億美元。兩位創辦人皆大有來頭。
‌
‌
‌
‌
‌
03-10科技
高效低成本！矽谷投資風向轉變不再迷戀大模型改追捧AI Agent
不久前，OpenAI、Anthropic 這樣的 AI 大廠還備受投資人追捧，每年投入數十億美元打造先進的大語言模型 (LLM)，但近來矽谷投資風向改變，轉而追捧 AI 智能體 (AI Agent)，曾經被瞧不起的 AI 應用公司，如今成了矽谷投資圈的當紅炸子雞。
‌
‌
‌
‌
‌

2025-03-05

03-05A股港股
華為高層：大模型Token流量激增33倍！
MWC 2025 期間，華為高層指出，過去 8 個月中國市場因 AI 產生的 Token 所帶來的流量已驚人成長 33 倍，其中付費 Token 貢獻了 15 倍的增長。華為董事、ICT BG CEO 楊超斌於會中表示，自 DeepSeek 推出後，中國市場每 Token 的價格大幅下降了 97%。
‌
‌
‌
‌
‌

2025-03-03

03-03美股雷達
OpenAI推「最大、最貴」模型GPT-4.5 極低性價比顯困境
OpenAI 推出旗艦大語言模型 GPT-4.5 研究預覽版，是該公司目前為止最大、最貴的版本，具備更強大的對話能力，但卻未見到決定性的優勢，讓市場難掩失望。OpenAI 稱 GPT-4.5 為知識最淵博的模型，撰寫能力更好、有更豐富的世界知識、而且比前代模型「有更鮮明的個性」，但但也警告 GPT- 4.5 並非前端模型，也可能效能不如 o1 或 o3-mini 。
‌
‌
‌
‌
‌
03-03科技
545%！DeepSeek首披露成本利潤率專家：若在美國已是一家價值逾百億美元公司
中國 AI 新創公司 DeepSeek 近來「開源」一波波，上周六 (1 日) 又有更大驚喜，全面揭秘 DeepSeek-V3/R1 推理系统，不僅公開其推理系統的核心優化方案，更首次披露成本獲利率等關鍵數據，引發產業震動。DeepSeek 上周六在知乎平台發佈首條文章，公佈模型推理成本利潤細節，並披露成本獲利率關鍵資訊，若所有 tokens 全按 DeepSeek-R1 的定價計算，理論上一天的總收入為 56 萬 2027 美元，成本獲利率為 545%，這一數字刷新全球 AI 大模型領域的獲利天花板。
‌
‌
‌
‌
‌

2025-02-27

02-27港股
騰訊發布新一代「秒回」AI模型Turbo S
騰訊 (00700-HK) 周四 (27 日) 正式推出自研快思考模式混元 Turbo S，宣稱是人工智慧領域在反應速度與性價比方面取得重大突破。這款新一代旗艦模型透過架構創新實現「秒級響應」，即日起向開發者和企業用戶開放 API 免費試用，並將逐步集成至騰訊元寶 AI 助手。
‌
‌
‌
‌
‌
02-27
一文看懂DeepSeek開源周第四天亮點：並行計算優化三劍客
DeepSeek 今 (27) 日又有大動作，推出並行計算優化三劍客 DualPipe、EPLB 以及 profile-data，其中一口氣開源兩項堪稱「AI 訓練加速神器」的技術，當中還有創辦人梁文鋒親自參與的 DualPipe 專案。專家認為，這對於動輒需要數百萬美元、耗時數月的大模型訓練來說是一劑「強心針」。
‌
‌
‌
‌
‌

2025-02-26

02-26
DeepSeek加速陸AI內捲！杭州「六小龍」風光大模型「六小龍」集體走向落寞
近來，「杭州六小龍」成為中國資本市場關注熱點，其中包括 DeepSeek、宇樹科技、遊戲科學、雲深處科技、強腦科技和群核科技，而杭州六小龍一片風光的同時，昔日的大模型「六小龍」卻正在快速掉隊。中國財經新媒體《礪石商業評論》報導，和 DeepSeek 同期發佈的 Kimi 全球強化學習模型 k1.5、階躍推理模型 Step R-mini，在模型能力上諸多層面接近 o1，但仍淹沒在 DeepSeek 火爆的輿論中，且跟 DeepSeek 的喧鬧相比，「六小龍」也接二連三爆出壞消息，先是零一萬物進一步拆分，後又發生月之暗面預算和仲裁案未和解以及 MiniMax 又一高管離職。
‌
‌
‌
‌
‌
02-26美股雷達
R2模型5月前推出？DeepSeek開源第三彈「300行DeepGEMM代碼」網友憂輝達股價
本星期是中國 AI 新創公司 DeepSeek 的開源周，DeepSeek 則在第三天，發佈了 DeepGEMM，是一個支援稠密和 MoE 模型的 FP8 GEMM(通用矩陣乘法) 計算庫，僅憑 300 行代碼就超過專家優化的內核，可為 V3/R1 的訓練和推理提供強大支援，更令人興奮的是，DeepSeek-R2 有望在 5 月前提前發佈。
‌
‌
‌
‌
‌
02-26
8G顯卡就能跑！阿里巴巴開源最強視頻生成模型萬相2.1 專家揭露五大優勢
阿里巴巴周二 (25 日) 全面開源視頻生成模型萬相 2.1，共兩個參數規模，140 億參數模型適用於對生成效果要求更高的專業人士，13 億參數模型生成速度較快且能相容所有消費級 GPU，專家則指出萬相 2.1 共有五大優勢。首先，在 SOTA 性能方面，萬相 2.1 在多個基準測試中優於現有的開源模型和商業解決方案，140 億參數專業版萬相模型在權威評測集 VBench 中以總分 86.22% 大幅超越 Sora、Luma、Pika 等國內外模型，居於榜首。
‌
‌
‌
‌
‌
02-26
最懂中國風！阿里全面開源視頻生成大模型「萬相2.1」 VBench榜單榮登第一
阿里巴巴 (09988-HK)(BABA-US) 也加入視頻大模型開源之爭，周二 (25 日) 晚間宣佈全面開源旗下視頻生成模型通義萬相 2.1，此次開源採用 Apache2.0 協定，14B 和 1.3B 兩個參數規格的全部推理代碼和權重全部開源，同時支援文生視頻和圖生視頻任務，全球開發者可在 Github、HuggingFace、魔搭社區下載體驗。
‌
‌
‌
‌
‌

2025-02-24

02-24科技
加速AI布局！傳字節跳動延攬谷歌高級副總吳永輝加盟親自操刀大模型開發
在 AI 領域蓬勃發展的當下，人才成為各企業競爭的關鍵資源，谷歌 (GOOGL-US)17 年老將，DeepMind 研究副總裁、Google Fellow 吳永輝最新傳出正式加盟字節跳動大模型團隊 Seed，專注於大模型基礎研究搜索、AI for Science 科研工作，直接向執行長梁汝波彙報。
‌
‌
‌
‌
‌
02-24科技
僅次DeepSeek！騰訊元寶下載量逆襲豆包成第二專家曝兩大原因
最新數據顯示，騰訊 (00700-HK) 元寶上周六 (22 日) 在中國的下載量突然超越豆包，升至中國區蘋果(AAPL-US) 免費 APP 下載排行榜第二，DeepSeek 則繼續位居榜首。騰訊元寶自 2 月 13 日宣布同時支援混元和 DeepSeek 兩大模型後，在一周內進行多次重大更新。
‌
‌
‌
‌
‌