傳微軟將推出自研新AI模型 力拚Google、Anthropic與OpenAI
鉅亨網編譯段智恆 2024-05-07 00:10
根據美媒《The Information》周一 (6 日) 援引知情人士消息報導,微軟目前正在開發自家人工智慧 (AI) 模型,力拚 Google(GOOGL-US)、Anthropic 以及 OpenAI。
報導指出,這是微軟向 OpenAI 投資逾 100 億美元以重新獲得後者 AI 模型使用權以來,首次開始訓練一個大規模內部 AI 模型。這個新模型在內部被稱為「MAI-1」,由微軟執行副總裁兼新部門「Microsoft AI」執行長 Mustafa Suleyman 負責,他曾是 Google DeepMind 的負責人,此前還擔任 AI 新創公司 Inflection 執行長,之後微軟收購了這家新創公司的大部分員工,並在 3 月份支付 6.5 億美元拿到智慧財產權。
不過內部人士透露,這個模型完全是微軟自己的,而非來自 Inflection,但可能基於來自該 Inflection 的訓練資料和其他技術。根據兩位知情的微軟員工表示,MAI-1 與 Inflection 之前發布的 Pi 模型是獨立的。
知情人士還說,MAI-1 將比微軟之前訓練過的任何小型開放原始碼模型都大,這意味著其需要更多的運算能力和訓練數據,因此成本更高。
MAI-1 將擁有約 5,000 億個參數,或者也可以根據訓練期間模型的學習內容來調整參數環境。相較之下,OpenAI 的 GPT-4 擁有超過 1 兆個參數,而像 Meta Platforms(META-US) 和 Mistral 等公司發布的小型開放原始碼模型則擁有 700 億個參數。
有分析認為,這意味著微軟現在正採取雙軌路線,旨在開發既能用於應用程式並可在行動裝置上運行的「小型語言模型」,同時又能開發更大、最先進的 AI 模型。一名知情人士表示,新模型的確切用途尚未確定,將取決於其表現。
這也透露微軟願意在 AI 領域開闢一條與 OpenAI 技術不同的新路,目前微軟的所有「Copilot」AI 聊天機器人都基於 OpenAI 的技術,可以自動產生電子郵件或快速總結文件。截至目前,微軟現在已經在 OpenAI 上投資逾 130 億美元,並將其模型添加到 Office 應用程式、其必應 (Bing) 搜尋引擎、Edge,甚至其 Windows 作業系統中。
與此同時,為訓練這個新模型,微軟已經為其配備大量搭載輝達 (NVDA-US) 顯卡的伺服器,並一直在編譯一系列訓練資料來提高模型的效能,其中包括從以前用於訓練小型模型的各種資料集中提取的數據,包括由 OpenAI 的 GPT-4 產生的文本,以及其他來源的信息,如網路上的公共數據。
知情人士表示,微軟可能會在本月稍後的 Build 開發者大會上提前展示這個新模型,具體取決於接下來幾周的開發進度。
截稿前,微軟 (MSFT-US) 周一盤中股價上漲 0.82%,每股暫報 409.93 美元。該公司股價今年迄今已經上漲超過 10%。
- 投資10至18歲孩子的最佳方案
- 掌握全球財經資訊點我下載APP
延伸閱讀
上一篇
下一篇