近1.4萬星,騰訊混元大模型開源成績單公布,多次登頂開源趨勢熱榜
記者獲悉,騰訊云副總裁,騰訊混元大模型負責人劉煜宏在2024開放原子開發者大會暨首屆開源技術學術大會上表示,騰訊將開源協同作為公司的核心技術戰略,積極推動內外部技術開源共享。騰訊混元大模型語言大模型、文生圖大模型、文生3D大模型以及文生視頻大模型等多個模態模型均已開源,未來大模型各版本也將進一步開源,與社區開發者一起共同推動技術生態繁榮發展。
(騰訊云副總裁,騰訊混元大模型負責人 劉煜宏)
騰訊混元大模型的開源模型已經全面覆蓋文生文、文生圖、文生3D以及文生視頻多個模態,是開源系列模型中較全的,其模型性能也得到了開源社區的高度認可,總GitHub Star(星星)數量近1.4萬顆,并且多次登頂趨勢榜。
其中,騰訊混元文生圖大模型在國內外衍生數量達1600多個,GitHub Star 超過3700,凝聚了數千名核心開發者。騰訊混元large模型開源五天內即在HugginFace百萬模型中脫穎而出,登趨勢榜榜首,GitHub Star 達1300。騰訊混元3D模型GitHub Star達到2500,開源兩周內成為HuggingFace下載增速最快的3D模型。
此外,騰訊混元文生視頻大模型 GitHub Star 已超過6300 ,發布后迅速登上開源趨勢熱榜,社區開發者還主動改進了多個衍生版本。例如,加州大學圣地亞哥分校(UCSD)的Hao AI實驗室研究員基于騰訊混元開源視頻生成模型發布 FastHunyuan 版本,新模型僅用1分鐘就能生成5秒長的視頻,比之前提速8倍,步驟也從50步減少到了6步,有效降低了模型應用門檻。
2024是大模型技術持續爆發的一年,騰訊不僅堅持全鏈路自研的大模型研發路線,率先實現從底層算力網絡到中間Angel機器學習平臺再到上層模型和應用到全鏈路自研,也通過積極開源,將成熟的技術與社區共享。
2024年5月,騰訊旗下的混元文生圖大模型全面升級并率先對外開源,包含模型權重、推理代碼、模型算法等完整模型,屬業內首個中文原生的DiT架構文生圖開源模型,支持中英文雙語輸入及理解。 評測數據顯示,騰訊混元文生圖模型效果遠超開源的 Stable Diffusion 模型,是當時效果最好的開源文生圖模型,整體能力屬于國際領先水平。
11月,騰訊混元宣布最新的MoE模型“混元Large“以及混元3D生成大模型“ Hunyuan3D-1.0”開源,支持企業及開發者精調、部署等不同場景的使用需求。騰訊混元Large是當時開源領域參數規模最大、效果最好的MoE模型,而騰訊混元3D生成大模型則是業界首個同時支持文字、圖像生成3D的開源大模型。兩個模型均屬騰訊自研,在架構、算法、數據等方面有獨特創新,填補了行業空白。
12月,騰訊混元生成視頻大模型宣布開源,參數量130億,是當前最大的視頻開源模型,開源內容包含模型權重、推理代碼、模型算法等完整模型,可供企業與個人開發者免費使用和開發生態插件。基于騰訊混元的開源模型,開發者及企業無需從頭訓練,即可直接用于推理,并可基于騰訊混元系列打造專屬應用及服務,能夠節約大量人力及算力,加速行業創新步伐。
本屆大會,騰訊還出品了數據庫開源專題論壇并參與大模型開源專題論壇,將騰訊在數據庫和大模型上的技術歷程與眾多開發者進行分享。
開源協同是騰訊的核心技術戰略,騰訊通過代碼的開源和協作,持續推動技術高效創新、開放共享。在騰訊內部,開源協同小組已經超過150個,覆蓋人工智能、大數據、數據庫等技術領域。對外,騰訊積極參與社區建設,主導近200個對外開源項目,在全球企業開源貢獻榜上名列前茅,總共吸引超50萬開發者關注。
早在2010年開始,騰訊就在公司層面開始推動外部開源工作的開展,現在已經由最初的開源的使用者,轉變為開源項目的核心貢獻者。同時,騰訊也是開放原子發起單位之一,自基金會2020年成立就積極參與開源,已捐贈操作系統、編譯器、數據庫等核心項目。
開源已經成為全球技術發展的主流趨勢,基于全球開發者眾研眾創的開源生態正加速形成。全球97%的軟件開發者和99%的企業使用開源軟件,未來,騰訊也將持續推動技術開源,與技術社區共同成長,推動技術進步。
- 免責聲明
- 本文所包含的觀點僅代表作者個人看法,不代表新火種的觀點。在新火種上獲取的所有信息均不應被視為投資建議。新火種對本文可能提及或鏈接的任何項目不表示認可。 交易和投資涉及高風險,讀者在采取與本文內容相關的任何行動之前,請務必進行充分的盡職調查。最終的決策應該基于您自己的獨立判斷。新火種不對因依賴本文觀點而產生的任何金錢損失負任何責任。