首頁 > AI資訊 > 最新資訊 > 支持文生視頻和圖生視頻,阿里旗下大模型萬相2.1宣布開源

支持文生視頻和圖生視頻,阿里旗下大模型萬相2.1宣布開源

新火種    2025-04-05

2月25日晚間,阿里巴巴宣布,阿里云視頻生成大模型萬相2.1(Wan)開源。此次開源采用Apache2.0協議,14B和1.3B兩個參數規格的全部推理代碼和權重全部開源,同時支持文生視頻和圖生視頻任務,全球開發者可在Github、HuggingFace、魔搭社區下載體驗。

通義萬相是阿里云通義系列AI繪畫創作大模型,可輔助人類進行圖片創作,于2023年7月7日正式上線。今年1月初,通義萬相視頻生成模型宣布升級至2.1版,憑借著優秀的表現,在權威評測榜單VBench中登上榜首。

微信公眾號“阿里云”截圖

公開資料顯示,此次開源共包括兩個參數版本模型。

其中14B版本萬相模型,在指令遵循、復雜運動生成、物理建模、文字視頻生成等方面表現突出,在權威評測集Vbench中,萬相2.1以總分86.22%大幅超越Sora、Luma、Pika等國內外模型,穩居榜首位置;1.3B版本萬相模型,超過了更大尺寸的開源模型,還和一些閉源的模型結果接近,同時能在消費級顯卡運行,僅需8.2GB顯存就可以生成480P視頻,適用于二次模型開發和學術研究。

演示材料顯示,萬相大模型在多個內部和外部基準測試中,均大幅超越現有的開源模型以及頂尖商業閉源模型。萬相能夠穩定展現各種復雜的人物肢體運動,如旋轉、跳躍、轉身、翻滾等;能夠精準還原碰撞、反彈、切割等復雜真實物理場景。在指令遵循能力方面,能夠準確理解中英文長文本指令,還原各種場景切換、角色互動。

相關推薦
免責聲明
本文所包含的觀點僅代表作者個人看法,不代表新火種的觀點。在新火種上獲取的所有信息均不應被視為投資建議。新火種對本文可能提及或鏈接的任何項目不表示認可。 交易和投資涉及高風險,讀者在采取與本文內容相關的任何行動之前,請務必進行充分的盡職調查。最終的決策應該基于您自己的獨立判斷。新火種不對因依賴本文觀點而產生的任何金錢損失負任何責任。

熱門文章