近期,OpenAI推出AI文生視頻模型Sora,憑藉超過一分鐘的生成視頻時長和逼真的視頻質量引起了轟動,成爲了討論的熱點,並將投資者的關注焦點再次引到了AI視頻賽道。

近日,天風全球前瞻產業研究院聯席院長孔蓉做客澎湃新聞《首席連線》節目,帶來對文生視頻在技術和應用層面的分析與展望。

Sora震撼在哪裏

“到了去年年底,其實作爲當時硅谷、然後基本整個產業交流的一個結論,大家也認爲在2024年,AI視頻會有比較大的變化和突破。”孔蓉表示。

孔蓉指出,此前出現的包括Pika和Runway在內的AI視頻模型,其生成視頻的時長相對比較短,在幾秒到十多秒不等,內容更多集中於動畫、動漫領域的一些生成,並且存在一致性的問題,經常在鏡頭中有不連貫的表現。

相比之下,Sora的演示視頻展現出了三大顯著進步:能夠生成時長六十秒的視頻,在生成真實世界的視頻內容時能夠做到更好的一致性跟連貫性,以及在整個內容呈現裏展現出了高質量:“它的確也有一些bug,大家看視頻時其實能夠發現一些問題,但是整體上他已經在往所謂的模擬現實世界的環境這條路上去走了,而且目前初期看到的這個效果還是非常讓人驚豔的。”

孔蓉表示:“所以跟原有的這個產品去比,不論是說從時長還是說從這個質量,或者是說它要達到的這個模擬現實世界的水平,都讓我們覺得是非常震撼的。”

比較有趣的一點在於,OpenAI的Sora報告顯示,其背後的部分核心概念和算法其實都是谷歌最先提出來的。是什麼讓OpenAI似乎總能夠在技術層面領先於其他有經驗的大廠?

孔蓉表示,雖然是谷歌最早發表了關於Transformer架構的論文,但谷歌當時採用的是另外一種路徑。而對於OpenAI這種創業公司,他們的願望是在整個比較寬鬆的環境裏面,按照自己的意圖去做出能夠真正實現AGI的產品:“(OpenAI)他們沒有什麼包袱,可以相對有一個寬鬆的創新環境。當然,我們還是認爲谷歌目前的技術實力、技術儲備依然是很強的,但是大公司可能考慮得更多,包括推出之後對於社會的影響,對於公司原有業務的一些影響。”

孔蓉也指出:“我認爲OpenAI可能還有一些祕密武器,我們現在可能看到的只是它其中的一部分。OpenAI後續可能還會有一些模型上比較驚豔的能力,可能會逐步地釋放出來。”

關注影視、廣告、電商等應用領域

在Sora的應用方面,毫無疑問,最受影響的影視行業正在密切關注其可能帶來的變化。

孔蓉表示:“我們其實覺得這種新技術和新的變化,它一定帶來的是行業的這個重要的機會,只是說你能不能很好地去應用這樣一個技術……在影視娛樂領域有大量的創意工作者,原本他可能要組建一個團隊,包括做視效、做特效的、做畫面的,然後花幾個月時間去生成一個內容。但是現在我們看到,這樣一個模型可能會讓產出的時間變得很短,原來幾個月的時間,現在可能用一週或者是更短的時間,就能夠去產出一部內容。”

另外,Sora也可能使得影視團隊的規模縮小,幾個人的團隊就能夠去產出一部不錯的影視內容。業內可能也會關注Sora能不能首先被運用到短視頻,然後再應用到更長的內容上去。

除了影視行業,孔蓉還提到了Sora爲廣告、電商等需要視頻素材的行業帶來的機遇。如果Sora能夠產出AI加3D場景,之後在遊戲領域也會得到很好的應用。

對於具體的未來投資領域展望,孔蓉認爲,首先,AI視頻將會提升對算力的需求。然後就是應用領域,包括上面說到的影視、廣告和電商行業,還有影視中間再細分出來的IP公司:“IP公司本身是圍繞着這個IP,可以生成不同形態的內容,不斷圍繞IP去做動畫、動漫、真人、文字或視頻的內容。但是原來因爲受制於整體內容製作的效率,可能產出的效率沒這麼高。現在有了AI視頻工具的進步,它可能對於這些IP公司來說,就讓整個IP變現的商業價值可能會進一步放大。”

此外,孔蓉還談到了AI視頻爲XR(擴展現實)領域帶來的機遇。加上不久前,蘋果首款MR(融合現實)頭顯Vision Pro的推出,也讓大家開始期待內容生態的發展:“我們現在看到了AI視頻製作的這些高精度的內容,不管是2D的、還是未來可能會產生3D的內容,就可以應用在頭顯裏,其實也會帶來整個XR板塊的機會。”

實現AGI的預期時間在不斷縮短

爲什麼今年年初以來,AI概念股能夠一直保持上漲趨勢?

孔蓉認爲,雖然目前除了ChatGPT以外,尚未看到特別突出的C端AI爆款應用,但是能夠在企業端和產業端觀察到與AI的切實結合,並帶來效率的提升:“效率提升帶來了企業競爭力的提升,就會帶來潛在的市場份額的提升。如果你不用上這種能提升生產效率的最先進的工具,可能就會落後。在這樣的一個背景下,包括大廠和我們看到的一些傳統應用都非常快地達成了一個共識,就是要開始投入這件事情。”

在這樣的判斷下,儘管資本界在去年三、四季度展現出了對AI的猶豫和不堅定態度,但在今年一月,隨着一些大廠和巨頭髮布的財報依然表現出對AI的重視,加強了大家的信心,並推動相關股票繼續表現良好。

2024年,仍然有許多AI大事值得投資者們關注。孔蓉指出,從OpenAI的GPT5、谷歌的Gemini到Meta的LLaMa,都會加強整個市場對整個AI領域的預期,以及它前進的腳步。

另一個備受矚目的話題則是AGI(通用人工智能)。孔蓉談到:“其實去年年底,我在市場跟大家交流的時候,一直提到2024年可能是一個AGI的元年。這個元年不是說我們2024年就會實現AGI,而是說會有AGI的突破。整個人工智能的能力,可能會往通用人工智能這條路上進一步地靠近。”在這次的產業革命中,對作爲基礎設施的算力的投入是相對確定性的。

什麼是真正的AGI?孔蓉認爲,就像人一樣,首先AI要具備很強的理解能力,然後要有很強的所謂記憶能力,還有決策能力。目前,AI的理解能力的確在不斷增強,記憶能力也有進步,但仍停留在分鐘的水平。至於尚處於初期的決策能力,未來的AI除了能夠聽懂用戶的意思、進行對話交流和完成一些簡單的任務以外,還要能夠完成一個相對需要一定環節跟流程的任務。

而近幾年來,業內人士對於實現AGI的預期時間都在不斷地縮短,Sora的出現也毫無疑問進一步縮短了大家的判斷。“去年我在硅谷跟一些技術圈的人在交流的時候,大家認爲整個這個AGI的時間可能在縮短,有百分之五十的概率會在2028年,也就是我們講距今三四年左右的時間可能會實現,那麼就比原來講的十年甚至以上的時間縮短了。”孔蓉表示。

(文章來源:澎湃新聞)

相關文章