【AI】阿里雲魔搭社區首發階躍星辰最新兩款開源多模態模型
經濟通新聞 2025-02-21 14:04
《經濟通通訊社21日專訊》今起一連3天在上海舉行的全球開發者先鋒大會(GDC)上,阿里雲魔搭社區首發階躍星辰最新開源的兩款多模態模型,包括基於300億參數、全球參數量最大的開源視頻生成模型Step-Video-T2V,以及業界首款產品級開源語音交互模型Step-Audio,而這兩款模型是近期全球多模態領域最熱門的開源模型。目前魔搭社區已上架超過4萬個開源模型,涵蓋LLM、對話、語音、文生圖、圖生視頻等多個領域,是中國最大的AI模型社區。
總部位於上海的大模型初創公司階躍星辰是「中國AI六小虎」之一,也是吉利的生態戰略合作夥伴。在Step-Video-T2V和Step-Audio開發過程中,雙方深度合作,在算力算法、場景訓練等領域優勢互補,顯著增強了多模態大模型的性能表現。雙方近日聯合宣布將這兩款模型向全球開發者開源,推動AI視頻創作普惠化。目前吉利自研星睿大模型已與這兩款模型完成融合,而這兩款開源模型亦將上線階躍星辰的App「躍問」。
據介紹,Step-Video-T2V是基於300億參數的文本轉視頻預訓練模型,能夠生成高達204幀的視頻,在指令遵循、運動平滑性、物理合理性、美感度等方面表現均顯著超過市面上既有的開源視頻模型。
Step-Audio是業界首個產品級開源語音模型,參數規模多達1300多億。根據Llama Question等5大主流公開測試,Step-Audio模型性能均位列第一,並在HSK-6(漢語水平考試六級)的測評中表現尤佳。(sl)
- 最新遺產稅怎麼算?傳承必知重點有哪些?
- 掌握全球財經資訊點我下載APP
文章標籤
上一篇
下一篇