技術(shù)成熟度有進(jìn)階,但速度等方面仍待提升OpenAI推出Sora新版本
當(dāng)?shù)貢r(shí)間12月9日,美國OpenAI公司正式發(fā)布最新版本的視頻生成大模型Sora-Turbo,它能夠根據(jù)文本、圖像或視頻輸入生成新的視頻內(nèi)容,這是繼今年2月推出首個(gè)版本以來的一次重要迭代。
針對(duì)新版本的發(fā)布,記者采訪了深耕計(jì)算機(jī)視覺領(lǐng)域的上海交通大學(xué)長聘教軌副教授謝偉迪。他表示:“相比第一個(gè)版本,Sora新版本顯著提升了實(shí)用性與技術(shù)成熟度。但這次新版本拖的時(shí)間太長,其他公司都追趕得差不多了。與國內(nèi)的視頻生成大模型‘可靈’相比,Sora新版本生成的視頻沒有展示出質(zhì)的飛躍。”
相比舊版本,Sora-Turbo有哪些“進(jìn)階”?謝偉迪表示,早期的Sora更像一個(gè)學(xué)術(shù)雛形,它通過擴(kuò)展數(shù)據(jù)量和模型規(guī)模,展現(xiàn)了視頻生成領(lǐng)域所能迸發(fā)的非凡潛力,也為當(dāng)時(shí)的生成模型研究指明了發(fā)展方向。盡管當(dāng)時(shí)未產(chǎn)出可供公眾使用的成品模型,Sora的探索已有力證明了數(shù)據(jù)與模型規(guī)模提升所帶來的驚人效果。
與國內(nèi)外不少視頻生成模型相比,Sora-Turbo如何?謝偉迪說:“雖然Sora-Turbo在生成復(fù)雜場(chǎng)景和多主體互動(dòng)視頻時(shí)表現(xiàn)不錯(cuò),能呈現(xiàn)較為真實(shí)的動(dòng)態(tài)效果和細(xì)膩的畫面細(xì)節(jié),但在對(duì)物理規(guī)律的深入理解與物理特性的精確模擬上仍有提升空間。例如,在生成物體運(yùn)動(dòng)或光影變化等場(chǎng)景時(shí),其結(jié)果可能不太符合現(xiàn)實(shí)物理特性。”與像Gen-3這樣的輕量化模型相比,其在硬件適配性和生成速度方面還有進(jìn)一步提升空間,以更好地滿足廣泛用戶的需求。
與部分更強(qiáng)調(diào)速度的模型相比,Sora-Turbo更注重生成內(nèi)容的合規(guī)性和道德規(guī)范,尤其在需要嚴(yán)格監(jiān)管的應(yīng)用場(chǎng)景中具有優(yōu)勢(shì)。“Sora目前沒有向我們開放,無法進(jìn)行規(guī)模化生成、測(cè)試。”謝偉迪說。
視頻生成大模型對(duì)我們的生活有什么潛在影響?謝偉迪認(rèn)為:這不僅大幅提升了視頻創(chuàng)作效率,還將為游戲的開發(fā)、玩耍和體驗(yàn)方式帶來創(chuàng)新,為講故事、互動(dòng)和沉浸式體驗(yàn)帶來新的可能性。
他說,借助視頻生成大模型,用戶只需提供簡短的文本描述,即可自動(dòng)生成高質(zhì)量視頻。這不僅節(jié)省了大量時(shí)間,也大幅降低了對(duì)專業(yè)技能的要求。視頻生成大模型的廣泛應(yīng)用有望改變廣告營銷、產(chǎn)品推廣和教育輔導(dǎo)等多個(gè)行業(yè)的內(nèi)容創(chuàng)作流程,推動(dòng)生產(chǎn)力的升級(jí)。在娛樂領(lǐng)域,視頻生成大模型提供的便利讓更多用戶能快速創(chuàng)作和分享創(chuàng)意,進(jìn)一步推動(dòng)短視頻文化的發(fā)展,或?qū)⒋呱鄤?chuàng)新形式和互動(dòng)體驗(yàn)。
但平衡技術(shù)創(chuàng)新與隱私保護(hù),是視頻生成大模型未來發(fā)展的關(guān)鍵所在。建立嚴(yán)格的數(shù)據(jù)保護(hù)措施、透明的使用政策以及完善的內(nèi)容監(jiān)管機(jī)制不僅是對(duì)用戶信任的維護(hù),更是推動(dòng)技術(shù)普及與創(chuàng)新的重要基礎(chǔ)。
(文章來源:解放日?qǐng)?bào))
- 免責(zé)聲明
- 本文所包含的觀點(diǎn)僅代表作者個(gè)人看法,不代表新火種的觀點(diǎn)。在新火種上獲取的所有信息均不應(yīng)被視為投資建議。新火種對(duì)本文可能提及或鏈接的任何項(xiàng)目不表示認(rèn)可。 交易和投資涉及高風(fēng)險(xiǎn),讀者在采取與本文內(nèi)容相關(guān)的任何行動(dòng)之前,請(qǐng)務(wù)必進(jìn)行充分的盡職調(diào)查。最終的決策應(yīng)該基于您自己的獨(dú)立判斷。新火種不對(duì)因依賴本文觀點(diǎn)而產(chǎn)生的任何金錢損失負(fù)任何責(zé)任。