cuda
美股雷達
AI 領域近日迎來重大突破,DeepSeek 利用 2048 個輝達 (NVDA-US)H800 GPU 的集群,在大約兩個月的時間成功訓練出一款包含 6710 億個參數的混合專家 (mixture of experts, MoE) 語言模型。
美股雷達
最新消息稱,DeepSeek 團隊走了一條不尋常的路——針對輝達 (NVDA-US)GPU 低階彙編語言 PTX 進行最佳化實現最大效能,有業界人士表示 CUDA 護城河不存在了。《新智元》報導,原本 DeepSeek 低成本訓出的 R1,就已經讓整個矽谷和華爾街為之一震。
2025-01-30