科技

輝達、MIT徑向注意力技術問世！AI影片生成速度飆升3.7倍、成本暴降4.4倍

鉅亨網新聞中心2025-07-08 17:10

美國麻省理工學院（MIT）與輝達 (NVDA-US) 近期聯合推出名為「徑向注意力」（Radial Attention）的創新技術，成功將 AI 長影片生成速度提升至 3.7 倍，同時將訓練成本大幅降低 4.4 倍，為高成本 AI 影片製作帶來重大突破。

傳統的擴散式影片生成模型普遍採用密集注意力機制，雖能保障畫質，但計算資源消耗驚人。根據實測，生成 10 秒影片的成本可能高達數千美元，隨著影片時長增加，成本呈指數型成長，限制了創作者與中小企業的應用空間。

‌

研究團隊受熱力學啟發，觀察到 AI 模型中的注意力分數，會隨時間與空間距離自然衰減。據此，他們設計出計算複雜度僅為 O(n log n) 的稀疏注意力架構，並命名為「徑向注意力」，有效減少遠距字符（token）間不必要的計算，節省大量算力資源。

與傳統模型如 SVG 需動態調整注意力不同，徑向注意力使用固定靜態掩碼，將時間與空間注意力統一處理。這使每個字符只需關注其鄰近區域，隨時間拉長自動收窄注意範圍，進一步減少不必要的運算負擔。

在主流模型 HunyuanVideo 與 Wan2.1-14B 上實測，使用徑向注意力後，生成 5 秒、720p 影片的推理時間從近 50 分鐘縮短至 13 分鐘，速度提升 3.7 倍；畫質評分（PSNR、SSIM）與原始模型基本持平，展現極高效率與穩定性。

影片生成最大的成本來自訓練階段。透過將徑向注意力搭配 LoRA（Low-Rank Adaptation）微調技術，企業與內容團隊可將訓練成本從數十萬美元降至幾萬元，讓 AI 影片生成技術更親民、更具普及潛力。

不同於其他需重訓模型的創新技術，徑向注意力可直接應用於既有的預訓練模型，並與藝術風格遷移等 LoRA 模組兼容，支援創作者進行風格化創作，顯著提升開發與部署效率。

從前，製作一支 1 分鐘 AI 影片對中小型內容團隊而言幾乎是不可能任務，如今隨著徑向注意力的應用，這項挑戰正在快速被克服。

‌