效果炸裂！OpenAI發佈首個視頻生成模型Sora：輸文字出視頻

智通財經獲悉，OpenAI將把人工智能技術帶到視頻領域。該公司週四推出了新的生成式人工智能模型Sora。Sora的工作原理類似於OpenAI的圖像生成人工智能工具DALL-E。用戶輸入想要的場景，Sora就會返回一個高清視頻剪輯。Sora還可以生成受靜態圖像啓發的視頻剪輯，並擴展現有視頻或填充缺失的幀。

隨着聊天機器人和圖像生成器進入消費者和商業世界，視頻可能成爲生成式人工智能的下一個前沿領域。雖然創造性的機會將激發人工智能愛好者，但隨着全球重大政治選舉的臨近，新技術帶來了嚴重的錯誤信息擔憂。

OpenAI希望通過Sora與Meta(META.US)和谷歌(GOOGL.US)等公司的視頻生成人工智能工具競爭。谷歌今年1月宣佈推出AI視頻大模型Lumiere。其他初創公司也有類似的人工智能工具，比如Stability AI，該公司有一款名爲Stable Video Diffusion的產品。亞馬遜(AMZN.US)還發布了“Create with Alexa”，這是一個專門生成基於提示的兒童動畫短片的模型。

Sora目前僅限於生成一分鐘或更短的視頻。在提供更廣泛的人工智能模型套件的努力中，由微軟(MSFT.US)支持的OpenAI將多模態(結合文本、圖像和視頻生成)作爲目標。

到目前爲止，Sora僅供一小部分安全測試人員或“紅隊”使用，他們測試該模型在錯誤信息和偏見等方面的漏洞。除了在其網站上可以找到的10個樣本片段外，該公司還沒有發佈任何公開演示，並表示將在週四晚些時候發佈隨附的技術論文。

OpenAI還表示，它正在構建一個“檢測分類器”，可以識別Sora生成的視頻片段，並計劃在其輸出中包含某些元數據，以幫助識別AI生成的內容。這是Meta在今年大選年用來識別人工智能生成的圖像的同一類型的元數據。

Sora是一種擴散人工智能模型，與ChatGPT一樣，它使用了谷歌研究人員在2017年的一篇論文中介紹的Transformer架構。OpenAI在聲明中寫道:“Sora是能夠理解和模擬現實世界的模型的基礎。”

責任編輯：於健 SF069