谷歌AI視頻模型深夜炸場:4K分辨率+2分鐘時長又給OpenAI“來了一槍”
《科創板日報》12月17日訊 Sora正式發布僅8天后,“谷歌版Sora”的2.0版本——Veo 2便正式發布。
據谷歌官網顯示,Veo 2可制作具有逼真動作和高質量輸出的視頻。其最高分辨率可達4K,時長可達2分鐘以上。谷歌方面表示,Veo代表著高質量視頻生成領域的重大進步。
除視頻清晰度有所長進外,Veo 2對物理世界和鏡頭控制的理解也是驚人的:
這段畫面的部分提示詞是:低角度跟蹤拍攝,18mm鏡頭。汽車漂移,留下光跡和輪胎煙霧。相機低速跟蹤,捕捉到光滑的橄欖綠色肌肉車接近拐角時的畫面。
該畫面部分提示詞為:特寫鏡頭聚焦于一位女DJ的臉部,她美麗、濃密的黑色卷發勾勒出她的五官。她閉上雙眼,沉浸在節奏中,嘴角掛著一絲微笑。當她隨著節拍點頭和搖擺時,相機捕捉到了她頭部的細微動作。
從上述案例可見,Veo 2在真實世界還原以及Prompt指令遵循方面都有不錯的表現。而在谷歌官網發布的性能評估中,Veo 2同樣打敗了Sora Turbo、可靈、MiniMaX等一眾海內外AI文生視頻大模型。
對此,谷歌總結稱,Veo 2在技術層面上的進步主要體現在三個方面。一是物理引擎的優化,這決定了AI視頻模型對于現實世界物理規律的深入理解。二是攝影技術的集成,能夠輸出更為豐富的視覺效果。最后是人物表現力的提升,使人物動作和表情更具實感。
目前,Veo 2已被引入谷歌旗下視頻創作工具VedioFX。就在上周,OpenAI正式推出Sora Turbo,向美國及其他市場的ChatGPT付費用戶開放。新版工具Sora Turbo可以生成最長達20秒的視頻,并且可以提供這些視頻的多種變體。
與此同時,國內文生視頻進展不斷。今年以來,國內企業開始加速研發并迭代AI視頻生成產品,產品能力不斷提升:
今年6月,快手AI團隊發布可靈AI視頻生成大模型,可生成長達2分鐘、分辨率達1080p的視頻;
7月,智譜AI上線視頻生成產品智譜清影,并在11月進行升級,支持生成時長為10秒的4K超高清視頻;
8月,字節推出即夢AI一站式創作平臺,隨后在11月宣布即夢AI視頻模型S2.0Pro和P2.0Pro上線。
山西證券12月12日研報指出,隨著AI視頻生成工具持續迭代,未來其向多種應用場景的滲透有望加速。一方面,應用層建議重點關注創意、設計、教育等多模態特別是視頻生成強相關的領域;另一方面,視頻生成模型對算力需求較文本顯著提升,重點關注AI算力相關標的。
- 免責聲明
- 本文所包含的觀點僅代表作者個人看法,不代表新火種的觀點。在新火種上獲取的所有信息均不應被視為投資建議。新火種對本文可能提及或鏈接的任何項目不表示認可。 交易和投資涉及高風險,讀者在采取與本文內容相關的任何行動之前,請務必進行充分的盡職調查。最終的決策應該基于您自己的獨立判斷。新火種不對因依賴本文觀點而產生的任何金錢損失負任何責任。