Meta AI生成影片 輸入文字輕鬆後製

Meta開發AI生成影片模型Movie Gen。Meta

輸入文字,輕鬆修改畫面。Meta

本報訊

Meta開發Movie Gen人工智能(AI)模型,看起來在AI影片製作上屬於一個大躍進,因為它能夠製作有聲影片,也可讓用戶利用文字輕鬆進行後製。

科技新聞網站Engadget報道,Movie Gen能以16 fps或24 fps(每秒顯示影格數)和從768 x 768 像素提升至1080p的畫質製作逼真且配樂的有聲影片。如果用戶上傳照片,它也可以生成個人化影片,更重要的是可僅用文字指令來進行後製。

值得注意的是,Movie Gen也可透過文字編輯非AI製作的正常影片,這部份很容易想像得到對於清理用戶在手機上為Instagram拍攝的內容有何幫助。不過Movie Gen僅用於研究目的,不會對外公開,因此外界有一些時間來思考這一切的意義。

繼Make-A-Scene 等媒體創作工具和利用其Llama AI 模型推出更多產品後,Meta形容Movie Gen為生成式AI研究的第三波。它採用300億參數「變換器」(transformer)模型,能以16fps生成16秒或以24fps生成10秒的短片。它也有130億參數語音模型,能以48 kHz製作含有環境聲音、音效和配樂等同步內容的45秒短片。Movie Gen團隊在其研究論文中提到,「由於我們的設計選項」,所以尚無同步語音支援。

Meta表示,Movie Gen最初透過「許可且公開的可用資料集組合」接受訓練,包括1億部影片、10億張圖像和100萬小時語音。該公司對資料來源含糊其辭—它已承認透過每位澳洲用戶的帳號數據來訓練的AI模型,但不清楚該公司使用哪些其產品以外的來源。

至於實際影片,Movie Gen乍看之下確實令人印象深刻,它的AI人類看起來很真實,沒有一般AI影片中明顯的痕跡。

儘管如此,Movie Gen團隊強調,生成式AI並非取代藝術工作者和動畫師,「我們分享這項研究的原因,是我們相信這項技術的力量協助人們以新方式表達自己,還有提供本來沒機會的人機會」。

但還不清楚一般用戶將如何使用生成式AI影片,例如會否利用AI影片取代自己拍攝的圖像?畢竟現在智能手機和電腦早有功能讓用戶輕鬆移除照片背景的物件,更複雜的AI影片後製似乎是符合邏輯的下一步。

科技-三藩市版