當(dāng)?shù)貢r間12月9日,OpenAI宣布正式向用戶開放人工智能(AI)視頻生成模型Sora,該系統(tǒng)可以根據(jù)文本提示生成逼真的視頻,這距離OpenAI首次公開預(yù)覽這款產(chǎn)品已過去了10個月時間。
根據(jù)OpenAI的介紹,Sora將於當(dāng)天晚些時候向美國及其他市場的ChatGPT付費(fèi)用戶開放。新版工具Sora Turbo可以生成最長達(dá)20秒的視頻,並且可以提供這些視頻的多種變體。
自今年2月首次預(yù)告Sora以來,OpenAI便開始與電影製片廠、媒體高管以及經(jīng)紀(jì)公司展開會談。OpenAI還允許一些藝術(shù)家、知名演員和導(dǎo)演試用該服務(wù)。
OpenAI聲稱Sora是一項(xiàng)理解和模擬現(xiàn)實(shí)的基礎(chǔ)性AI技術(shù),是開發(fā)能夠與物理世界互動模型的重要一步。
然而,Sora在早期測試中顯示出明顯的局限性。據(jù)悉,在一次測試中,Sora存在「多餘肢體」的問題,並對物理現(xiàn)象的理解不夠準(zhǔn)確。此外,與圖像生成器或聊天機(jī)械人相比,Sora生成每個視頻所需的時間和算力明顯更多了。
OpenAI行政總裁奧爾特曼表示,初期Sora的使用仍然受限,ChatGPT Plus訂閱用戶可以每月生成50個低解像度視頻,ChatGPT Pro訂閱用戶可以無限制的「較慢」生成高解像度視頻,以及500個快速生成的視頻。
除了視頻生成的數(shù)量和速度會有限制之外,Sora在歐洲大部分地區(qū)也無法使用,因?yàn)闅W洲的科技監(jiān)管更嚴(yán)格。
在當(dāng)天的演示中,OpenAI還展示了Sora的新功能。該公司表示,該工具不僅可以通過文本提示生成視頻,還能夠基於靜態(tài)圖片和已有視頻創(chuàng)建新的內(nèi)容。例如,用戶可以上傳一段視頻剪輯,Sora會生成擴(kuò)展這個片段的後續(xù)畫面,使視頻變得更長、更完整。
Sora還包含一個名為Storyboard的選項(xiàng),用戶可以通過它詳細(xì)描述希望視頻在不同時間點(diǎn)發(fā)生的內(nèi)容,從而更好地指導(dǎo)一系列片段的生成。此外,Sora還提供了一個功能,讓用戶可以瀏覽其他人創(chuàng)作的視頻集錦。
Sora的發(fā)布是OpenAI為期12天的產(chǎn)品直播活動的一部分,上周已推出了更昂貴的ChatGPT Pro訂閱選項(xiàng),可無限制訪問OpenAI最強(qiáng)大的AI模型。
雖然Sora是世界上第一個視頻生成模型,但自它問世以來,同類產(chǎn)品已經(jīng)是百花齊放,比如Google的Veo、快手可靈、Runway的Gen-3、字節(jié)跳動PixelDance等。
與此同時,這些可以快速地製作視頻的工具正在顛覆影視行業(yè),人們已經(jīng)開始探索如何將這項(xiàng)技術(shù)應(yīng)用於電影製作。