OpenAI週四發佈了首個視頻生成模型Sora,該模型的主要功能是可以提供文本轉視頻。斯坦福大學博士生、師從李飛飛教授的Jim Fan(範麟熙)對Sora進行了點評:

以下爲Jim Fan的點評內容,由知名互聯網資訊博主“寶玉xp”翻譯:

如果真有某個超越我們認知的存在編寫了構成我們現實世界的模擬程序代碼,我們甚至可以嘗試估算這個程序編譯後的二進制文件大小。以Meta AI開發的Emu Video爲例,它擁有60億參數。假如說有一個名爲Sora的系統,其規模是Emu Video的10倍,並採用了bfloat16格式,那麼這位“創造者”的程序大小可能不會超過111Gb。

但這裏有幾點需要注意:

- 實際上,這樣的代碼可能比我們設想的Sora系統要簡單得多,因爲Sora離達到Kolmogorov複雜度(一種衡量對象信息量的方法,代表了最短的無損壓縮數據長度)還有很長的路要走;

- Sora系統的設計不僅僅是爲了模擬我們所知的世界,而是能夠包含所有可能存在的世界。換句話說,我們所經歷的現實只是Sora能夠模擬出的衆多可能性之一;

- 就像在遊戲設計中,使用虛幻引擎5(Unreal Engine 5)創建逼真場景時不需要渲染出每一個細節,我們的物理世界也可能在我們未觀察它之前的某些部分實際上是不存在的。

責任編輯:於健 SF069

相關文章