國內春節假期尚未結束,大洋彼岸的OpenAI就投放了一枚“深水炸彈”,讓許多人感嘆AI技術迭代太快,一批從業者面臨“開工即失業”的危險。

北京時間2月16日,OpenAI重磅發佈了首個文生視頻模型Sora。根據OpenAI的官方簡介,Sora可以製作長達60秒的視頻,視頻包括了高度清晰的場景、複雜的鏡頭動作,並可支持多個角色的創作。OpenAI在社交平臺上發佈了48個從9秒到60秒長度不等的視頻樣片,效果大幅超越了此前備受追捧的Runway和Pika等AI視頻創業公司,引發廣泛關注。

業內人士分析,Sora模型的發佈將徹底變革傳統影視製作過程,賦能內容創業行業降本增效,但也將對動畫師、特效製作、視頻拍攝剪輯等從業人員帶來巨大沖擊。Sora模型發佈後,港股AIGC概念走高。Wind數據顯示,截至2月16日收盤,港股AIGC(生成式人工智能)指數的54家成份股中,44家上漲。其中,閱文集團漲幅達10.14%,金山軟件漲7.84%,阿里影業漲6.98%,商湯漲6.25%,知乎漲5.87%,嗶哩嗶哩漲4.73%。

可生成60秒連貫逼真視頻

根據OpenAI官方介紹,用戶可以通過使用自然語言提示詞(Prompt),生成長達1分鐘的視頻。Sora模型對語言有深刻的理解,因而能夠準確地理解提示詞,並生成令人信服的人物,而且可以在一個生成的視頻中創建多個鏡頭,在這些鏡頭中準確地保持角色和視覺風格的一致性。

Sora與其他的AI視頻相比,主要有以下幾方面的優勢:

一是視頻長度可達60秒。OpenAI在官網上放出了48個視頻樣片,其中最爲廣泛流傳的是其中一個長度爲1分鐘的視頻。在該視頻中,一名穿着紅色裙子和黑色夾克的女子正行走在日本東京街頭,背景中的街道霓虹閃爍,人羣熙攘。

在這則60秒的視頻中,主人物一直在行走,背景街道中的景色及人物不斷變化,但是主人物保持高度連貫性。在Sora模型發佈之前,Runway、Pika等AI視頻創業公司僅能做到幾秒左右的視頻連貫性。半年前,Runway將視頻長度從4秒提升至18秒,且將效果提升至4K超高清水平,已被業界視爲“天花板”。然而,Sora模型將長度從18秒拉長至60秒的水平,且效果逼真、細節生動,將行業的水位提高到了難以企及的高度。

二是可實現單視頻多角度鏡頭自然切換。在上述的“女子行走在東京街頭”視頻樣片中,後半段鏡頭由大全景切換至近景及人物臉部特寫,轉換十分絲滑。在另外一個視頻樣片中,一隻狼對着月亮嚎叫,鏡頭也是從大全景自如地切換至中近景。同一個視頻中採用多個不同景別和角度的分鏡,且銜接自然毫無違和感,這是Sora模型令許多人感到驚豔的重要原因。

三是超高清和超逼真。在時長大幅提升的同時,Sora模型生成的視頻保持高清的畫質和逼真的效果。人物臉部的皮膚特點、動物毛髮的特徵都栩栩如生,細節處理上十分出色。

不過,Sora模型並非盡善盡美。在OpenAI放出的視頻樣片中,就有不少Sora模型“擺烏龍”和“翻車”的例子。例如,在其中一個樣片中,提示詞爲“一個人跑步的場景,35毫米電影膠片”,Sora生成的視頻搞反了人物在跑步機上跑步的方向;在另外一個樣片中,提示詞爲“考古學家在沙漠中發現了一把普通的塑料椅子,正小心翼翼地挖掘和除塵”,Sora生成的視頻出現了椅子變形及自動行走等詭異的場景。

OpenAI表示,目前Sora模型還有一些顯著的弱點,比如難以準確模擬複雜場景的物理特性、無法理解因果關係,還可能混淆提示詞的空間細節。一些業內人士也對Sora模型的實際效果提出了質疑,美國伊利諾伊大學厄巴納-香檳分校的教授Ted Underwood在接受媒體採訪時表示,OpenAI可能有選擇性地挑選了表現最好的視頻向公衆展示。

目前,Sora模型尚未面向公衆開放。OpenAI的CEO山姆·奧特曼在社交平臺表示,目前Sora正在開展紅隊測試(一種安全評估方法),僅面向少數人開放。據介紹,OpenAI正與相關領域專家合作,對Sora模型可能存在的錯誤信息、仇恨與偏見內容進行研究與測試,確保產品安全及符合人類倫理。

影視行業將迎徹底變革

“Sora模型具備高級影視特效的製作能力,擁有改變影視製作遊戲規則的力量。”清華大學新聞學院教授、博士生導師瀋陽向證券時報記者表示。

瀋陽認爲,從發佈的視頻樣片來看,Sora模型已經實現了對流體、毛髮、火焰、光影追蹤等元素的生成,且能夠生成長達一分鐘的視頻。通過文本預測多幀組合排序,Sora模型解決了視頻中主體一致性的挑戰,可以實現複雜的影視級別的運鏡,降低一鏡到底拍攝的複雜性。這意味着未來影視拍攝將大幅度減少現場調度的壓力和資金成本的耗費,減少後期特效的壓力,縮短作品製作時長。

“解決了人物一致性問題之後,AI生成視頻將大踏步前進,AI視頻進入大爆發期。今年,我們大概率可以看到不需要演員的較長的電影。”瀋陽說。

由於解決了視頻生成的時長、連貫性、逼真度等難題,Sora模型讓人們看到了AI賦能視頻製作的廣闊前景,讓目前十分火熱的短視頻、短劇等影視行業從業者哀鴻遍野,“瑟瑟發抖”,害怕自己的工作被AI取代。

今年1月,一份面向好萊塢300名領導者的調查報告顯示,四分之三的受訪者認爲AI工具將取代相關的工作崗位。該報告還顯示,聲音工程師、配音演員、後期特效製作、影視剪輯等工作崗位將最先受到衝擊,且影響將隨着AI工具的不斷進化而擴大。與此同時,業內人士分析,Sora模型將利好編劇行業,因爲劇本、文本創作能力將成爲影視製作中的核心競爭力。

一名業內人士向記者表示,Sora模型是一把“雙刃劍”。既可能導致部分視頻從業者失業,也將幫助企業和個人提升視頻製作效率,促進視頻行業朝着更加高端和創新的方向發展。

360創始人周鴻禕認爲,AI對影視行業的顛覆不一定那麼快能到來。“機器能生產一個好視頻,但視頻的主題、腳本和分鏡頭策劃、臺詞的配合,都需要人的創意,至少需要人給提示詞。一個視頻或者電影是由無數個60秒組成的,今天Sora可能給廣告業、電影預告片、短視頻行業帶來巨大的顛覆,但不一定那麼快能擊敗TikTok,更可能成爲TikTok的創作工具。”周鴻禕表示。

申萬宏源研究所互聯網傳媒行業首席分析師、總監林起賢此前在接受證券時報記者採訪時表示,生成式AI對於內容行業專業從業者來說,能夠提高生產效率和降低製作成本,例如在短劇生產製作中,已經可以用AI工具實現一鍵換臉、對口型等功能。“未來隨着AI工具的不斷進化,我們甚至可以看到普通用戶製作AI微電影、AI動畫電影等。”林起賢說。

責編:萬健禕

校對:高源

相關文章