稀疏注意力
美股雷達
綜合外媒周一 (29 日) 報導,中國 AI 新創公司 DeepSeek 發布實驗性新模型 V3.2-Exp,新模型採用創新的「稀疏注意力」機制,可降低運算成本並提升長文本處理能力,同時 API 價格調降超過 50%。V3.2-Exp 模型採用 DeepSeek 稀疏注意力 (DeepSeek Sparse Attention, DSA) 機制,該公司表示這項技術能削減運算成本,並提升某些類型的模型效能。
2025-09-29
美股雷達
綜合外媒周一 (29 日) 報導,中國 AI 新創公司 DeepSeek 發布實驗性新模型 V3.2-Exp,新模型採用創新的「稀疏注意力」機制,可降低運算成本並提升長文本處理能力,同時 API 價格調降超過 50%。V3.2-Exp 模型採用 DeepSeek 稀疏注意力 (DeepSeek Sparse Attention, DSA) 機制,該公司表示這項技術能削減運算成本,並提升某些類型的模型效能。