Meta新智能 可將文字生成短片

Meta的Make-a-Video憑藉新人工智能可將文字生成視頻短片。Meta

Meta今年7月公佈其Make-a-Scene文字轉成圖像人工智能(AI),像Dall-E和Midjourney一樣利用機器學習算法連同大量線上藝術品數據庫,創建書面提示的稀奇古怪描述。Meta執行長朱克伯格周四(9月30日)再公佈Make-a-Scene更生動版本,那就是Make-a-Video。

根據朱克伯格的Meta網誌,正如其名,Make-a-Video是一款全新AI系統,「讓人們將文字轉化成簡短但高質素的短片」。在功能上,Video的做法與Scene一樣—依賴混合自然語言處理(NLP)和生成神經網絡,將非視覺提示轉化成圖像—只不過Video以不同格式提取內容。

Meta研究人員在一份周四早上刊登的研究報告中提到,「我們直覺很簡單︰了解世界長怎樣和還有如何從對應文本圖像數據描述它,從未被規管的短片中了解世界如何運作」。他們又指,「此舉使本團隊減少訓練Video模型的時間,消除對應文本圖像數據的需要,又可保存現有圖像生成模型的廣泛性(像審美的多元性和稀奇古怪的描述等)」。

正如Meta大多數AI研究一樣,Make-a-Video以開放源項目形式被釋出。朱克伯格提到,「我們想要在我們如何創建像這樣的生成AI系統上深思熟慮。我們正對外公開分享這項生成AI研究和結果以聆聽外界的意見,將繼續利用我們具責任的AI框架工作,重新定義和進化我們對這項新興技術的方法」。

像每種被釋出的生成AI一樣,Make-a-Video被濫用的機會可不小。為了杜絕任何惡作劇的可能,Meta研究團隊先發制人,預先掃除Make-a-Video訓練數據組內任何不宜圖像和有毒語句。本報訊

科技-三藩市版