文字生成視頻Veo2模型 開放訂戶使用

谷歌的文字轉視頻模型Veo 2開放供Gemini Advanced訂戶使用。谷歌

谷歌15日宣布,即日起正式開放被喻為可製作具有「電影真實感」高解析度影像的文字轉視頻模型Veo 2給Gemini Advanced訂戶使用。訂戶可從Gemini網頁版和行動版的下拉式選單選擇Veo 2,輸入提示即可生成8秒720p短片。

不過訂戶每月生成視頻數目有限制,谷歌表示,當訂戶生成數目快到上限時會發出通知。雖然Veo 2以MP4格式輸出視頻,但行動版用戶會有「分享」選項,直接將這些人工智能(AI)生成短片上傳至影音平台YouTube和社交平台TikTok。

谷歌表示,更新後的AI模型對真實世界的物理現象和人類肢體動作有「更好的理解能力」,讓它可以呈現「更流暢的角色動作、逼真的場景以及於不同主題和風格下更細緻的視覺細節」。Veo 2生成的短片具備SynthID數碼浮水印,表明它們是用AI所製作。

谷歌又將Veo 2與AI創作工具Whisk整合。Whisk是谷歌實驗室一項實驗性功能,讓用戶使用圖像向Gemini提示來創作新圖像。新功能Whisk Animate讓用戶利用Veo 2將他們透過AI生成的圖像轉化為8秒短片。

谷歌實驗室為谷歌早期AI產品試驗平台,僅限於每月繳付20元訂閱Google One AI Premium計劃的用戶使用。本報訊

科技-三藩市版