OpenAI新模型Sora 文字生成逼真短片

Sora生成視頻中,一對情侶雪中漫步。OpenAI

OpenAI發布新模型Sora,展示多條由Sora生成的高清視頻,包括這條長達一分鐘的視頻。OpenAI

OpenAI發布了全新模型Sora,能根據文字提示生成長達一分鐘的高清視頻。Sora在日語中是「天空」的意思,它不會很快向公眾開放。據Engadget報道,OpenAI將把它提供給一小群學者和研究人員,由他們評估其危害性及被濫用的可能性。

該公司在網站上表示:「Sora能夠生成包含多個角色、特定動作類型以及主體和背景細節準確的複雜場景。該模型不僅能理解用戶在提示中提出的要求,還能理解這些東西在現實世界中是如何存在的。」

網站分享了由Sora生成的多條視頻。其中一段顯示一對情侶雪中漫步東京城,櫻花、雪花在他們周圍飄揚。另一段視頻顯示,在雪山背景下,造型逼真的長毛象穿過白雪覆蓋的草地。

OpenAI表示,該模型「對語言的深刻理解」讓它能夠準確解釋文本提示。不過,與迄今所有AI圖像和視頻生成器一樣,Sora也並非完美無缺。

在一個例子中,提示要求輸入一段視頻,內容是一只達爾馬提亞犬透過窗戶看著「沿著運河街道行走和騎單車的人們」,但生成的視頻中卻完全忽略了人和街道。OpenAI警告說,該模型在理解因果關係方面可能會有困難——例如,它可以生成一個人吃餅乾的視頻,但餅乾上可能沒有咬痕。

Sora並不是第一個文生視頻模型。Meta、Google和Runway等公司都曾預告或者發布過文字轉視頻的工具。不過,目前還沒有其他工具能生成長達60秒的視頻。

Sora還能一次性生成整個視頻,而不是像其他模型那樣一幀一幀地拼接在一起,這就確保了視頻中的主體即使暫時離開視線也不會改變。

文生視頻工具的興起引發了人們的擔憂,因為它們可能更容易製作出逼真的假視頻。

OpenAI表示,正在與錯誤信息、仇恨內容和偏見等領域的專家合作,在向公眾提供該工具之前對其進行測試。該公司也在開發能夠檢測出Sora生成的視頻的工具,並在生成的視頻中加入元數據,以方便識別。

公司拒絕透露Sora是如何訓練的,只是說它既使用了「公開視頻」,也使用了版權持有者授權的視頻。

科技-三藩市版