OpenAI今日發佈了一款新的AI產品Sora,用戶只需輸入文本,即可生成一段極其逼真且富有想象力的視頻,從而將戰事正酣的AI競賽引向好萊塢。

OpenAI旗下的ChatGPT可以在不上法學院的情況下通過律師考試,而Sora則希望在不上電影學院的情況下拍攝電影。OpenAI稱,Sora能夠根據文本指令生成一段60秒的視頻,同時保持視覺質量。

它對語言有深刻的理解,能夠準確領會提示,生成令人信服的角色。Sora可生成具有多個角色、特定類型運動、精確主題和背景細節的複雜場景。還可以在單個生成視頻中創建多個鏡頭,準確保留角色和視覺風格。

OpenAI今日還分享了幾個樣本視頻,證明了通過文本生成視頻的可能性。分析人士稱,這是一個新的研究方向,也是2024年值得關注的一個趨勢。OpenAI科學家Tim Brooks表示:“建立一套大模型,能夠理解視頻,理解我們世界中所有這些非常複雜的交互,是未來所有AI系統的重要一步。”

Sora 1

動畫場景中有一個短小的毛茸茸的怪物蹲在融化的紅色蠟燭旁的特寫鏡頭。藝術風格是3D和逼真的,重點是照明和紋理。這幅畫的氣氛是一種驚奇和好奇,因爲怪物睜大眼睛和張開嘴巴凝視着火焰。它的姿勢和表情傳達出一種天真無邪和嬉戲的感覺,彷彿它是第一次探索周圍的世界。暖色和戲劇性燈光的使用進一步增強了圖像的舒適氛圍。

Sora 2

一個渲染精美的紙製珊瑚礁世界,到處都是五顏六色的魚和海洋生物。

Sora 3

幾隻巨大的毛茸茸的猛獁象在白雪覆蓋的草地上走近,它們長長的毛茸茸的皮毛在風中輕輕飄動,遠處是白雪覆蓋的樹木和山脈。下午三點左右的光線,遠處的一縷雲彩和高處的太陽,創造了溫暖的光芒。

Sora 4

美麗、白雪皚皚的東京市熱鬧非凡。鏡頭穿過熙熙攘攘的城市街道,跟蹤幾個人享受美麗的下雪天氣,並在附近的攤位購物。絢麗的櫻花花瓣和雪花隨風飄揚。

儘管這些視頻已經足夠驚豔,但Sora還有一個沒有展示的功能,OpenAI團隊可能在很長一段時間內也不會發布,那就是從單個圖像或一系列幀生成視頻的能力。Brooks說:“這將是提高講故事能力的另一種很酷的方式。”

它可以準確地畫出你腦海中的東西,然後讓它栩栩如生。OpenAI意識到這一功能有可能產生深度假冒和錯誤信息。Sora項目的研究人員Bill Peebles稱:“對於這方面的影響我們非常小心。”

預計與Dall-E 3一樣, OpenAI將在暴力和色情等方面對Sora的內容進行限制。還有一個潛在的問題是,Sora製作的視頻內容是否會侵犯他人的版權作品。

從“文字生成視頻”要威脅到實際的電影製作,可能還需要很長一段時間。儘管OpenAI所展示的視頻令人印象深刻,但它們無疑都是精心挑選的,展示了Sora最好的一面。在沒有更多信息的情況下,很難知道它們對模型的典型輸出有多大的代表性。

而且,也不能簡單地將120個一分鐘長的Sora片段拼接在一起來製作連貫的電影,因爲模型不會以完全相同的方式對提示做出反應,連續性難以保持。

但不管怎樣,Sora已經開啓了新的征程,並且勢必將對娛樂和內容創作行業帶來衝擊。市場研究公司ABI research高級分析師Reece Hayden稱,像Sora這類AI模型將對數字娛樂市場產生重大影響,新的個性化內容將在各個渠道傳播

相關文章