Sora成不了王炸嗎Meta人工智能負責人銳評:搞搞視頻就得了
財聯社2月23日訊(編輯 馬蘭)
OpenAI日前推出的視頻生成模型Sora持續引爆相關概念,被視為視頻生成服務的重大突破。然而,來自競爭對手的科學家卻潑了一盆冷水。
Sora因其視頻穩定性和清晰度而受到市場青睞,但還有一些人對其給予更高厚望,認為其或許有機會沖擊人工智能的高峰——世界模擬器,這也是OpenAI喊出的口號。
OpenAI也在其官網文章中寄望,Sora絕不僅僅是個視頻生成器,而是一個現實世界的模擬器。通過學習和模擬數據分布,生成與真實世界相似的虛擬樣本,從而給現實世界提供預知信息。
但這一前景被Meta的首席AI科學家Yann LeCun公開反駁,這位以直言不諱聞名的AI大佬直言:搞搞視頻就好,別吹有的沒的。
注定失敗的模擬器
LeCun在X上公開發文稱,通過生成像素來對世界進行模擬是一種資源浪費,且注定會失敗。而該貼也引發了極大關注,一眾網友在評論區華山論劍。
簡單來說,LeCun認為Sora模型試圖推斷太多不相關的細節,就像是通過試圖分析足球的材料來判斷足球的運行軌跡。
他指出,生成式模型適用于文本內容,因為文本是離散的,且是由數量有限的符號組成的數據,在這種情況下,處理預測中的不確定性變得十分容易。但如果換到以像素為單位的預測領域,不確定性就會變得非常棘手,且不可能成功。
底下的網友也紛紛發言,有人稱Sora雖然令人印象深刻,但幾乎每個場景都可能出現邏輯問題,比如藝術家測試視頻中三頭小狼莫名其妙分裂成五頭小狼。這讓模擬現實變得多少不太靠譜。
也有人說,Sora是應夢想而生,人可以做清醒的夢,或者做不太清醒的夢。這種看起來不太清醒的發言則是賭Sora有那么一些可能實現OpenAI“世界模擬器”的壯言。
與此同時,LeCun所在的Meta上周發布了一個視頻聯合嵌入預測架構V-JEPA,據稱其通過觀看視頻來教導大模型理解和對物理世界建模,算是Sora之外,對世界模擬器的另一種嘗試。
此外,V-JEPA還可以靈活丟棄不可預測的信息,而將訓練和樣本運行效率提升1.5-6倍。不過,V-JEPA顯然顯然沒在市場引發多大動靜,相比Sora要低調很多。
- 免責聲明
- 本文所包含的觀點僅代表作者個人看法,不代表新火種的觀點。在新火種上獲取的所有信息均不應被視為投資建議。新火種對本文可能提及或鏈接的任何項目不表示認可。 交易和投資涉及高風險,讀者在采取與本文內容相關的任何行動之前,請務必進行充分的盡職調查。最終的決策應該基于您自己的獨立判斷。新火種不對因依賴本文觀點而產生的任何金錢損失負任何責任。