Google新招曝光!Gemini把照片變短影片還有音效超吸睛
鉅亨網編譯段智恆
根據《彭博》周四 (10 日) 報導,Google(GOOGL-US)宣布,其付費訂閱用戶現可透過 Gemini 人工智慧 (AI) 助理,將靜態照片轉換為短影音片段,這項新功能將率先於網頁版上線,並於本周內陸續推送至 Gemini 手機應用程式。

這項功能是 Google 先前在開發者大會上推出的 Veo 3 影片生成模型的一部分,當時僅開放給少數專業創作者。如今,訂閱 Google AI Ultra 與 Pro 計畫的用戶,在部分地區可透過 Gemini 的聊天介面上傳照片並加入描述文字,即可生成長達 8 秒的影片。影片格式為 16:9 橫式、720p 解析度,並支援音效輸出,將以 MP4 格式提供下載。
Google 表示,這項功能的推出是為了與 OpenAI 和專攻 AI 影片生成的 Runway AI 等對手競爭。中國的阿里巴巴 (BABA-US)(09988-HK)、快手(01024-HK) 與新創公司 Manus 近期也推出或更新類似技術,全球 AI 影像生成領域戰火持續升溫。
這項功能目前仍有部分限制。Google 強調為確保使用者體驗「適當」,禁止使用公開可辨識人物 (如名人、政治人物、知名執行長等) 來生成影片,也不允許鼓勵危險行為或煽動暴力與霸凌的內容。
不過,這項技術尚未完全成熟。《彭博》在測試中發現,若要求 Gemini 將個人照片生成對話影片,系統有時會改變人物的臉部特徵,甚至膚色。此外,若指示人物跳霹靂舞,Gemini 僅會生成人物揮手畫面,無法準確執行複雜動作。但若是靜物、植物、繪畫等畫面,則表現良好。
對此,Google 發言人回應,模型並未被設計為改變人物外貌,系統僅會基於單一影像進行延伸生成,有時可能無法完美呈現原始影像的樣貌。未來將持續優化面部動畫與整體表現。
延伸閱讀
上一篇
下一篇