menu-icon
anue logo
澳洲房產鉅亨號鉅亨買幣
search icon
雜誌

科技創新轉捩點

理財周刊 2023-12-15 09:38

文.洪寶山

在高利率、地緣政治衝突加劇、供應鏈脫鉤的經濟環境以及矽谷銀行倒閉的背景下,2023 年對科技初創企業來說是滅頂的一年,根據 Carta 平台統計,今年初創企業的風險投資資金減少了一半以上,已有 543 家初創企業倒閉,年度融資金額正逼近 2015 年以來的最低水準,幸好人工智慧和生物技術的融資仍然相對強勁。

OpenAI 憑藉 ChatGPT 爆紅 輝達訂單滿手席捲 AI 晶片市場

2023 年的人工智慧,可以說是 OpenAI 的天下,憑藉 ChatGPT 的爆紅,這家初創企業一躍成為最具價值的 AI 初創公司,最新估值達到 860 億美元,半年翻了三倍。

在 AI 晶片領域,輝達的 H100+CUDA 軟體幾乎壟斷了今年 AI 晶片市場,H100 晶片市價四萬美元左右,使得輝達前三季營收翻兩倍到 181 億美元,而且訂單滿手中。

微軟率先發難自研 AI 晶片,以求降低成本的同時,發展更貼近自家企業所需的 AI 晶片,Meta、OpenAI 和微軟在 12/6 舉行的 AMD 投資者大會上,表示將使用 AMD 最新的人工智慧晶片 Instinct MI300X。可預見 2024 年是反輝達聯盟集結的一年,但輝達領先十多年建立的 CUDA 軟體可不是吃素的,CUDA 軟體一直是 AI 開發者目前青睞輝達 GPU 的主要原因之一,到時候還有得瞧。

2024 年各方勢力集結 對抗輝達 AI 晶片一家獨大

AMD 的 MI300X 最大特點是擁有 192GB 的 HBM3,這種記憶體傳輸資料的速度更快,可以容納更大的人工智慧模型。AMD 將 MI300X 及其構建的系統與輝達的 H100 進行了比較,晚了半年問世的 MI300X 的浮點運算速度比 H100 高 30%,記憶體頻寬比 H100 高 60%,記憶體容量更是 H100 的兩倍以上。

但 MI300X 對輝達最新的旗艦 H200 的優勢就沒那麼明顯了,記憶體頻寬僅比後者多出個位數,容量比後者大近 40%。光有強而有力的晶片並不足以扳倒輝達的領先地位,因為輝達配合 ChatGPT-3、4 模型運作的效果最好,如果沒有其他 LLM 大模型配合運作,證實 AMD 搭配新的大模型的效能足以取代 H100+ChatGPT 的話,買家不會輕易捨棄輝達、選擇 AMD 的。

相較於簡單將純文字、純視覺和純音訊模型拼接在一起的傳統模型,12/7 谷歌至今最強大的大模型 Gemini 上線,Gemini 在開發之初就在不同模態上進行了訓練,根據谷歌內部消息,Gemini 有萬億參數,訓練所用的算力甚至達到 GPT-4 的五倍,從自然圖像、音訊、視頻理解到數學推理,Gemini Ultra 在 32 個常用的學術基準的 30 個上,已經超越 GPT-4!值得一提的是,Gemini 並沒有依賴輝達晶片算力,是由 Google 自研 TPU v4 和 TPU v5e 訓練出來的大模型。

另外不讓谷歌專美於前,不同於谷歌的封閉式 LLM 大模型,Meta 和 IBM 選擇走類似 Android 系統的開放式競爭路線,聯合成立了 AI 聯盟。Meta 計畫把 MI300X GPU 用於人工智慧推理任務,微軟表示會把 MI300X 部署在雲端運算服務 Azure 中,甲骨文的雲端運算服務也會使用 MI300X。OpenAI 也會在一款叫做 Triton 的軟體產品中使用 AMD GPU,可預見 2024 年將是各方勢力集結對抗輝達在 AI 晶片的一家獨大壟斷。

雲端 AI 基建使 GPU 大缺貨 邊緣 AI 算力攸關生成式 AI 擴展

雲端 AI 的基礎建設使得 GPU 大缺貨,但個人消費者並非所有的應用都要上傳到雲端 AI 去運算,AI 的邊緣運算正在抬頭。未來 AI 推理的規模將遠高於 AI 訓練,推理成本將隨著日活使用者數量及使用頻率的增加而增加,而雲端推理的成本掌握在雲企業手中,這將導致規模化擴展難以持續,因此布局邊緣 AI 算力是生成式 AI 規模化擴展的重要一步。

通過壓縮 AI 大模型和終端軟硬體的配合,企圖做到在 PC 與手機上運行 AI 模型跟雲端 GPU 運算一樣快,但成本更低、回應速度更快、服務效率更高等目標。生成式 AI 與邊緣 AI 走在前面,倒逼 PC 與手機硬體性能大升級。蘋果的新一代 M3 系列晶片中,M3Max 支援開發數十億參數 AI 模型。蘋果與 Meta 等在 XR 眼鏡中也有望逐步接入 AI。

明年期待邊緣 AI 應用先落地 後年迎接 AI 終端硬體創新升級

谷歌大模型 Gemini 家族中專門為移動裝置訓練模型的 Nano 版本將配備在谷歌最新一代旗艦機 Pixel 8 Pro,Gemini 大模型最核心亮點在於對視頻多模態的理解能力。華為 Mate60、小米 14、vivoX100 發布會中,都重點介紹了 AI 功能。三星 2024 年 Galaxy S24 手機發布會中,預期高斯 AI 模型將是主打功能。

聯想首款 AI PC 已面世,2024 年 CES 展上,華碩將展示 AI PC,考慮到 AI 算力由雲端向邊緣裝置端延伸,硬體升級趨勢可望推動換機潮加速,邊緣 AI 的大模型具備 GPT3.5 至 GPT4 水準能力,可望從 PC 與手機端開始滲透,然後逐步延伸到 MR、穿戴式電子、汽車、智慧家庭、機器人等各類終端設備,2024 年是個期待邊緣 AI 應用落地的一年,2025 年或將迎來全面一輪的 AI 終端硬體創新升級趨勢。

來源:《理財周刊》1216 期

更多精彩內容請至 《理財周刊






Empty