大模型企業擁抱開源,視頻模型集體加入
2月18日,昆侖萬維(300418)開源首個面向AI短劇創作的視頻生成模型SkyReels-V1,及基于視頻基座模型的表情動作可控算法SkyReels-A1。
針對當前全球AI視頻生成模型和產品不開源、用不到、費用高、不好用等痛點,昆侖萬維此次開源的兩款模型和算法,可幫助解決傳統短劇制作面臨的挑戰,如線下拍劇涵蓋劇本創作、選演員、場景布景、分鏡創作、拍攝、后期處理等復雜流程,大模型有助于縮減成本。
SkyReels-V1針對表演細節打標,利用好萊塢級別數據訓練微調。
據介紹,為提升表情生成、肢體生成的可控表演效果,SkyReels-V1針對表演細節打標,利用好萊塢級別數據訓練微調。針對人物微表情、人物表演細節、場景描述、光影、畫面構圖等進行更精細的技術升級。為了實現更加精準可控的人物視頻生成,昆侖萬維開源了基于視頻基座模型的表情動作可控算法SkyReels-A1,支持視頻驅動的電影級表情捕捉,能夠基于任意人體比例生成高度逼真的人物動態視頻,以及皮膚肌理、身體動作跟隨等多維度細節的深度還原。
同日,大模型企業階躍星辰與吉利汽車集團聯合開源兩款多模態大模型,包括開源視頻生成模型階躍Step-Video-T2V、開源語音交互大模型階躍Step-Audio。階躍星辰表示,此次聯合開源旨在促進大模型技術的共享與創新,推動人工智能普惠發展。
據階躍星辰介紹,階躍Step-Video-T2V模型參數量達300億,可直接生成204幀、540P分辨率的視頻。階躍Step-Video-T2V在復雜運動、美感人物、視覺想象力、基礎文字生成、原生中英雙語輸入和鏡頭語言等方面能力突出。
上海對外經貿大學人工智能與變革管理研究院副院長、上海開源信息技術協會秘書長張國鋒此前對澎湃科技表示,開源是數字經濟公共基礎設施,開源在物理世界萌芽發展、逐步壯大,成為數字經濟創新創業主導模式,這是歷史趨勢。作為社會創新方法論的開源降低了創新創業門檻,激發了創業熱情,將改變軟件的產業鏈和供應鏈,改變游戲規則。DeepSeek讓人們看到了開源的重要性,開源項目將雨后春筍般涌現,2025年是開源大發展之年,一場波瀾壯闊的開源社會運動正在開展。
- 免責聲明
- 本文所包含的觀點僅代表作者個人看法,不代表新火種的觀點。在新火種上獲取的所有信息均不應被視為投資建議。新火種對本文可能提及或鏈接的任何項目不表示認可。 交易和投資涉及高風險,讀者在采取與本文內容相關的任何行動之前,請務必進行充分的盡職調查。最終的決策應該基于您自己的獨立判斷。新火種不對因依賴本文觀點而產生的任何金錢損失負任何責任。