menu-icon
anue logo
熱門時事鉅亨號鉅亨買幣
search icon


科技

輝達、MIT徑向注意力技術問世!AI影片生成速度飆升3.7倍、成本暴降4.4倍

鉅亨網新聞中心


美國麻省理工學院(MIT)與輝達 (NVDA-US) 近期聯合推出名為「徑向注意力」(Radial Attention)的創新技術,成功將 AI 長影片生成速度提升至 3.7 倍,同時將訓練成本大幅降低 4.4 倍,為高成本 AI 影片製作帶來重大突破。

cover image of news article
輝達、MIT徑向注意力技術問世!AI影片生成速度飆升3.7倍、成本暴降4.4倍。(圖:Shutterstock)

傳統的擴散式影片生成模型普遍採用密集注意力機制,雖能保障畫質,但計算資源消耗驚人。根據實測,生成 10 秒影片的成本可能高達數千美元,隨著影片時長增加,成本呈指數型成長,限制了創作者與中小企業的應用空間。


研究團隊受熱力學啟發,觀察到 AI 模型中的注意力分數,會隨時間與空間距離自然衰減。據此,他們設計出計算複雜度僅為 O(n log n) 的稀疏注意力架構,並命名為「徑向注意力」,有效減少遠距字符(token)間不必要的計算,節省大量算力資源。

與傳統模型如 SVG 需動態調整注意力不同,徑向注意力使用固定靜態掩碼,將時間與空間注意力統一處理。這使每個字符只需關注其鄰近區域,隨時間拉長自動收窄注意範圍,進一步減少不必要的運算負擔。

在主流模型 HunyuanVideo 與 Wan2.1-14B 上實測,使用徑向注意力後,生成 5 秒、720p 影片的推理時間從近 50 分鐘縮短至 13 分鐘,速度提升 3.7 倍;畫質評分(PSNR、SSIM)與原始模型基本持平,展現極高效率與穩定性。

影片生成最大的成本來自訓練階段。透過將徑向注意力搭配 LoRA(Low-Rank Adaptation)微調技術,企業與內容團隊可將訓練成本從數十萬美元降至幾萬元,讓 AI 影片生成技術更親民、更具普及潛力。

不同於其他需重訓模型的創新技術,徑向注意力可直接應用於既有的預訓練模型,並與藝術風格遷移等 LoRA 模組兼容,支援創作者進行風格化創作,顯著提升開發與部署效率。

從前,製作一支 1 分鐘 AI 影片對中小型內容團隊而言幾乎是不可能任務,如今隨著徑向注意力的應用,這項挑戰正在快速被克服。



Empty