來源:每日經濟新聞

每經記者 蔡鼎    每經編輯 蘭素英    

剛剛躋身全球第三大初創公司的OpenAI在中國春節期間又甩出“王炸”。繼文本模型ChatGPT、圖像模型Dall-E大放異彩後,其最新推出的“文生視頻”技術Sora又以其“逼真”和“富有想象力”的生成內容吸引了廣泛的關注和討論。

Sora的誕生讓許多行業既興奮期待又惶恐不安。當被問及哪些行業將面臨顛覆時,一位從事AI大模型研究多年的匿名人士對《每日經濟新聞》記者表示,“首當其衝的將是AI視頻、AI圖片賽道上的玩家。Sora的出現,意味着視頻生成門檻大幅降低。廣告、影視、短視頻等行業也會有較大改變。”

然而,出人意料的是,Sora的行業衝擊尚未顯現,美股二級市場卻掀起了一股“腥風血雨”。

Sora發佈的次日,美國電腦軟件公司Adobe股價暴跌超7%;美國圖片庫、圖片素材、圖片音樂和編輯工具供應商Shutterstock跌超5%;幾周前發佈了“文生視頻”工具Lumiere的谷歌母公司股價下挫1.58%。3家公司一天內就合計蒸發近480億美元(摺合人民幣近3500億元)的市值。

Sora具有碾壓優勢

OpenAI官網介紹,Sora是一種擴散模型,它從看起來像靜態噪聲的視頻開始生成視頻,然後通過多個步驟消除噪聲來逐漸對其進行轉換生成視頻。Sora能夠一次生成整個視頻,或擴展生成的視頻。通過一次性爲模型提供多個幀的預見,OpenAI解決了一個具有挑戰性的問題,即確保主題即使暫時離開視野也保持不變。

與GPT模型類似,Sora使用Transformer架構,建立在過去對DALL-E和GPT模型的研究之上。它使用DALL·E 3的重述技術,該技術涉及爲視覺訓練數據生成高度描述性的標題。因此,該模型能夠更精準遵循生成用戶的文本指令。

《每日經濟新聞》記者注意到,大多數主要的AI公司多年來一直在研究“文生視頻”工具,一些公司已經發布用戶可以使用的軟件。在Sora發佈之前,最新版本的Runway就是最先進的“文生視頻”技術,可以根據文本提示製作短視頻。

從OpenAI發佈的演示視頻看,Sora生成的視頻有絲滑的移動運鏡、場景轉換,還可以自行分鏡、切換景別,這意味着Sora可能讓普通人以極低的門檻製作自己的電影。更值得一提的是,此前的文生視頻模型,由於是生成單鏡頭,一旦輸入新提示詞,就會生成新鏡頭,主角就會變換,而Sora生成的視頻,在視角轉換、鏡頭景別切換後,仍保持主體的一致性。

中信建投認爲,Sora採用擴散模型+Transformer模型,通過一定的數據處理實現了更爲廣泛的數據集,Sora模型帶來的震撼背後是一次數據驅動下的能力突破。基於海量數據訓練的Sora模型同樣觀察到了大語言模型中的湧現現象,Sora能夠深度模擬現實世界中人類、動物和環境的物理規律,標誌着人工智能在理解真實世界場景並與之互動方面邁出了重大的一步,Sora或成爲實現通用人工智能的重要里程碑。

談到Sora相較於市面上已有的“文生視頻”類技術的優勢時,一位從事AI大模型研究多年的匿名人士在接受《每日經濟新聞》記者採訪時指出,首先是生成視頻的時長,之前“文生視頻”技術普遍水平在4秒,Sora現在可以直接1分鐘,時間越長,一致性、連貫性的難度也陡增;其次,Sora可以基於一個提示詞,生成不同角度的視頻,類似現實中的多機位拍攝,表明它已經可以構建一個三維的空間;另外,Sora還可以“文生視頻”“圖生視頻”,甚至“視頻生視頻”,可用性明顯增加;最後,Sora似乎展現了模擬真實世界物理規律的能力,但這一點還有爭議,如果成真,那也就意味着世界向通用人工智能邁出了一大步。

而針對Sora對行業的衝擊,上述人士對《每日經濟新聞》記者說道:“首當其衝的將是AI視頻、AI圖片賽道的玩家,OpenAI在這方面展示了碾壓性實力,算法、算力、數據的難度比文本大模型更高,成爲同行追趕的硬門檻。Sora的出現,意味着視頻生成門檻大幅降低。廣告、影視、短視頻等行業也會有較大改變,但Sora只是降本增效的工具,核心依然是內容創意。”

多家美股公司受衝擊

然而,讓人始料不及的是,Sora的第一波衝擊,卻是在美股二級市場上。

美國電腦軟件公司Adobe在Sora發佈的次日(2月16日)股價暴跌7.41%,創去年11月1日以來新低,市值在短短一個交易日蒸發近198億美元。

Adobe主要從事多媒體制作類軟件的開發,近年亦開始涉足互聯網應用程序、市場營銷應用程序、金融分析應用程序等開發。Adobe開發的非線性編輯之視頻剪輯軟件,被廣泛用於視頻剪輯等領域。

同日,美國圖片庫、圖片素材、圖片音樂和編輯工具供應商Shutterstock跌5.44%,市值一個交易日蒸發9360萬美元。

公開資料顯示,Shutterstock總部位於紐約,由程序員和攝影師強·歐寧傑於2003年創立,該公司擁有約2億張免版稅的圖片、矢量圖和插圖庫,還有約1000萬個影片剪輯和音樂曲目可授權給用戶使用。

X(原推特)上有用戶發帖稱,Shutterstock每年銷售價值約10億美元的庫存照片和視頻,(但現在)人們意識到人工智能生成的視頻和圖像可能會摧毀這個行業。在這條帖子的下方,特斯拉CEO馬斯克評論表示,“是的”。

此外,美國搜索引擎巨頭谷歌母公司Alphabet當日也下跌1.58%,市值一天蒸發279億美元,且表現落後於微軟(下跌0.72%)、亞馬遜(下跌0.69%)和Meta(上漲2.27%)等美股藍籌股。

就在OpenAI發佈Sora的幾周前,谷歌纔剛發佈視頻生成模型Lumiere。有分析認爲,強大的Sora讓谷歌的Lumiere顯得相形見絀。股價的下跌凸顯了市場對OpenAI人工智能服務可能影響谷歌在搜索行業主導地位的擔憂,但分析師認爲,OpenAI正在開發的搜索產品給Alphabet帶來的風險相對較小。

相關文章