橫評國內15個主流大模型,騰訊混元綜合實力領跑第一梯隊
近日,全球增長咨詢公司弗若斯特沙利文發布了《2024年中國大模型能力評測》,對國內主流的15個大模型進行了權威評測。文心一言取得了綜合第一,而緊隨其后的,是亮相后一直低調的騰訊混元大模型。測評結果顯示,騰訊混元在通用基礎能力和專業應用能力上均領先國內其他大模型。
值得一提的是,文心一言、騰訊混元等排名前四的大模型,不僅處于國內第一梯隊,而且高于國際大模型均線,這條均線的設置,是以Gemini10、GPT4、GPT3.5和Claude2為基準的,可以說意味著這四家大模型具備了國際主流大模型的競爭力水平,含金量十足。
沙利文《2024年中國大模型能力評測》:大模型綜合競爭力氣泡圖
據了解,這份報告以用戶使用體驗和實際使用價值為衡量標準,綜合考量數理科學、語言能力、道德責任、行業能力及綜合能力等5大核心維度及21個細化二級維度。具體細分的維度目前批露的不多,不過可以看到,在語言能力的評測中,文心一言、通義千問、騰訊混元分別位列前三。
中國大語言模型能力評析:語言能力
作為全鏈路自研的通用大語言模型,騰訊混元具備強大的中文創作能力,復雜語境下的邏輯推理能力,以及可靠的任務執行能力。
在騰訊最新發布的2023年第四季度及全年業績報告中,對混元大模型的實力進行了肯定。財報寫到:“騰訊混元已經發展成為領先的基礎模型,在數學推導、邏輯推理以及多輪對話中性能卓越。”財報還披露,騰訊混元采用混合專家模型結構,已擴展至萬億參數規模。
不僅如此,近日中國電子學會公布了2023科學技術獎,由騰訊主導,北京大學、北京科技大學共同參與的聯合項目Angel機器學習平臺獲本年度科技進步一等獎,Angel 機器學習平臺是支撐騰訊混元大模型的核心技術。
除了通用基礎能力外,在大模型落地看重的專業應用能力評測中,騰訊混元也在此次測評中排名領先。據介紹,目前騰訊內部有超過400個業務及場景已接入騰訊混元測試。
比如,騰訊廣告基于混元大模型推出了AI廣告創意平臺妙思,有效提高了廣告生產及投放效率。企業微信和騰訊會議部署了生成式AI功能,增強了商業化效果。騰訊云還聯合生態伙伴,將大模型技術與20多個行業結合,提供超50個行業大模型解決方案。騰訊自身豐富的業務和場景大量接入騰訊混元,也意味著大模型已經在應用端驗證了價值。
當前,國內大模型賽道的重點已經從通用技術向落地能力轉移,AI的能力逐漸從文生文,到文生圖、文生視頻,圖生圖、圖生視頻等多模態方向發展。企業也將進一步關注大模型能否真正與應用相結合,助力各行各業的高質量發展。
- 免責聲明
- 本文所包含的觀點僅代表作者個人看法,不代表新火種的觀點。在新火種上獲取的所有信息均不應被視為投資建議。新火種對本文可能提及或鏈接的任何項目不表示認可。 交易和投資涉及高風險,讀者在采取與本文內容相關的任何行動之前,請務必進行充分的盡職調查。最終的決策應該基于您自己的獨立判斷。新火種不對因依賴本文觀點而產生的任何金錢損失負任何責任。