“硬剛”DeepSeek!阿里云Qwen2.5-Max升級發布,稱新模型所有測試全面超越【附中國大模型行業市場規模】
圖源:攝圖網
1月30日晚間消息,阿里云宣布通義千問旗艦版模型Qwen2.5-Max升級發布。
Qwen2.5-Max模型是阿里云通義團隊對MoE模型的最新探索成果,預訓練數據超過20萬億tokens。該模型展現出極強勁的綜合性能,在多項公開主流模型評測基準上錄得高分,全面超越了目前全球領先的開源MoE模型以及最大的開源稠密模型。
通義團隊分別對Qwen2.5-Max的指令(Instruct)模型版本和基座(base)模型版本性能進行了評估測試。
指令模型是所有人可直接對話體驗到的模型版本,在Arena-Hard、LiveBench、LiveCodeBench、GPQA-Diamond及MMLU-Pro等基準測試中,Qwen2.5-Max比肩Claude-3.5-Sonnet,并幾乎全面超越了GPT-4o、DeepSeek-V3及Llama-3.1-405B。
基座模型反映模型裸性能,由于無法訪問GPT-4o和Claude-3.5-Sonnet等閉源模型的基座模型,通義團隊將Qwen2.5-Max與目前領先的開源MoE模型 DeepSeek V3、最大的開源稠密模型Llama-3.1-405B,以及同樣位列開源稠密模型前列的Qwen2.5-72B進行了對比。在所有11項基準測試中,Qwen2.5-Max全部超越了對比模型。
目前,Qwen2.5-Max已在阿里云百煉平臺上架,模型名稱qwen-max-2025-01-25`,企業和開發者都可通過阿里云百煉調用新模型API。同時,也可以在全新的Qwen Chat平臺上中使用Qwen2.5-Max,直接與模型對話,或者使用artifacts、搜索等功能。
2024年中國大模型行業市場規模將達到205億元
大模型是指包含超大規模參數(通常在十億個以上)的神經網絡模型。神經網絡模型則是指基于神經網絡結構構成的數學模型,它受到人腦神經系統結構的啟發,由人工神經元(節點)和它們之間的連接組成。這些連接具有權重,可以通過學習過程進行調整,從而使得神經網絡能夠學習和適應輸入數據的模式。2023年中國大模型行業市場規模達到132.3億元,近三年復合增速達到106.61%。初步估算,2024年中國大模型行業市場規模將達到205億元。
滲透情況
盡管大模型的發展起步較晚,且實際商業化應用也僅僅只有短短1-2年,但當前已經滲透到多個行業。截至2023年,金融、政府、影視游戲和教育領域是大模型滲透率最高的四大行業,滲透率均超過50%。電信、電子商務和建筑領域的應用成熟度較高。
產業競爭
中國AI大模型行業正快速發展,頭部企業包括百度、阿里巴巴、騰訊、華為等,依托強大的技術實力和算力資源展開競爭。百度的文心大模型、阿里的通義千問等已在多行業實現落地,騰訊與華為則在云計算和AI芯片上發力。初創企業如商湯、云從科技等在細分領域表現亮眼。整體行業呈現技術創新與應用加速落地并行的趨勢,但仍面臨算法優化、成本控制和國際競爭等挑戰。
零一萬物CEO李開復表示,大模型中國創業公司已經出現發展路徑分野,2025年將迎來洗牌,每家公司都會或主動或被動地找到自己的商業落地點和公司的獨特性。純基座大模型的公司以后可能非常少,甚至只有兩三家,可能會在自有模型的基礎上,或在別人的模型上迭代。
- 免責聲明
- 本文所包含的觀點僅代表作者個人看法,不代表新火種的觀點。在新火種上獲取的所有信息均不應被視為投資建議。新火種對本文可能提及或鏈接的任何項目不表示認可。 交易和投資涉及高風險,讀者在采取與本文內容相關的任何行動之前,請務必進行充分的盡職調查。最終的決策應該基于您自己的獨立判斷。新火種不對因依賴本文觀點而產生的任何金錢損失負任何責任。