階躍星辰聯合吉利開源兩款多模態大模型打造開源大模型的中國新勢力
2月18日,階躍星辰和吉利汽車集團聯合宣布,將雙方合作的階躍兩款Step系列多模態大模型向全球開發者開源。該兩款大模型分別為Step-Video-T2V視頻生成模型和Step-Audio語音模型。
其中,階躍Step-Video-T2V模型的參數量達到300億,可以直接生成204幀、540P分辨率的高質量視頻。從生成效果來看,階躍Step-Video-T2V在復雜運動、美感人物、視覺想象力、基礎文字生成、原生中英雙語輸入和鏡頭語言等方面具備強大的生成能力,且語義理解和指令遵循能力突出,能夠高效助力視頻創作者實現精準創意呈現。
階躍Step-Audio是行業內首個產品級的開源語音交互模型,能夠根據不同的場景需求生成情緒、方言、語種、歌聲和個性化風格的表達,能和用戶自然地高質量對話。模型生成的語音具有超自然、高情商等特征,同時也能實現高質量的音色復刻并進行角色扮演,滿足影視娛樂、社交、游戲等行業場景下應用需求。
階躍星辰是吉利汽車集團的科技生態戰略合作伙伴。雙方在算力算法、場景訓練等領域優勢互補,顯著增強了多模態大模型的性能表現。此次聯合開源的行動,旨在促進大模型技術的共享與創新,推動人工智能的普惠發展。
吉利汽車集團CEO淦家閱表示:“目前,吉利全棧自研的星睿AI大模型已經與階躍Step-Video-T2V、Step-Audio等大模型完成了深度融合,將為用戶帶來更智能、更高階的座艙交互與智駕出行體驗,推動AI科技在智能汽車領域的普及。”
據了解,這也是階躍星辰首次開源其Step系列基座模型。階躍星辰創始人、CEO姜大昕表示:“階躍星辰一直以實現AGI為目標堅持研發基座大模型。我們相信多模態模型是實現AGI的必經之路,但目前尚處于早期階段,期待與社區開發者集思廣益,共同拓展模型技術邊界,并推動產業落地。”
- 免責聲明
- 本文所包含的觀點僅代表作者個人看法,不代表新火種的觀點。在新火種上獲取的所有信息均不應被視為投資建議。新火種對本文可能提及或鏈接的任何項目不表示認可。 交易和投資涉及高風險,讀者在采取與本文內容相關的任何行動之前,請務必進行充分的盡職調查。最終的決策應該基于您自己的獨立判斷。新火種不對因依賴本文觀點而產生的任何金錢損失負任何責任。