中日韩亚洲人成无码网站,色网在线观看视频,蜜桃臀av高潮无码

首頁 > AI資訊 > 最新資訊 > 最新全球模型榜單：阿里Qwen2.5-Max超DeepSeekV3！又一國產大模型海外出圈！

最新全球模型榜單：阿里Qwen2.5-Max超DeepSeekV3！又一國產大模型海外出圈！

新火種 2025-02-05

今日（2月4日）凌晨，Chatbot Arena LLM Leaderboard更新了最新一期的榜單，不久前發布的Qwen2.5-Max直接沖進前十，超越DeepSeek V3, o1-mini和Claude-3.5-Sonnet等模型，以1332分位列全球第七名！同時，Qwen2.5-Max在數學和編程上排名第一，在Hard prompts方面排名第二。

https://lmarena.ai/?leaderboard

Qwen-Max是阿里云通義團隊對MoE模型的最新探索成果，新模型展現出極強勁的綜合性能。在Arena-Hard、LiveBench、LiveCodeBench、GPQA-Diamond及MMLU-Pro等主流基準測試中，Qwen2.5-Max比肩Claude-3.5-Sonnet，并幾乎全面超越了GPT-4o、DeepSeek-V3及Llama-3.1-405B。

ChatBot Arena官方賬號 lmarena.ai 對其評價稱，阿里巴巴的Qwen2.5-Max在多個領域表現強勁，特別是在專業技術向的（編程、數學、有難度的提示詞等）方面。

據了解，Chatbot Arena是由LMSYS Org推出的大模型性能測試平臺，目前集成了190多種模型。該榜單采用匿名方式將大模型兩兩組隊，交給用戶進行盲測，用戶根據真實對話體驗對模型能力進行投票。因此Chatbot Arena LLM Leaderboard成為全球頂級大模型的最重要競技場。

此前，Qwen2.5-72B-Instruct發布后也曾闖入Chatbot Arena榜單全球前十，是得分較高的中國大模型；Qwen2-VL-72B-Instruct闖入Vision榜單第九，是成績優異的開源模型。

目前，企業可在阿里云百煉調用Qwen2.5-Max模型的API，開發者也可在Qwen Chat平臺中免費體驗Qwen2.5-Max。

Qwen2.5-Max發布后，在海外開發者中引發了大量關注。有網友在對比DeepSeek-V3 和 Qwen 2.5后，高度贊揚了Qwen2.5-Max的出色表現。

還有網友打趣地為OpenAI的首席執行官Sam Altman擔憂：又一個中國模型來了

不少海外網友表示，中國新模型的迭代速度和質量令人驚艷。

作為國內較早開源自研大模型的科技大廠，阿里云旗下的通義千問已實現全尺寸、全模態的開源，推出了包括語言大模型、多模態大模型等多種類型的開源模型。

在全球范圍內，Qwen的衍生模型數量超9萬個，已超越Llama成為全球更大的開源模型群。此次Qwen2.5-max的發布，亦備受全球各種語言的開發者的歡迎。

“有了Qwen2.5-max，我們能對ChatGPT說再見了？！”有使用阿拉伯語的網友如是說。

多名海外網友用英文表達了對Qwen2.5-max極致性能的驚嘆。

通義團隊方面表示，持續提升數據規模和模型參數規模能夠有效提升模型的智能水平。通義團隊對下一個版本的Qwen2.5-Max充滿信心，也將持續探索，除了在預訓練的scaling 上繼續探索外，還將大力投入強化學習的scaling，希望能實現超越人類的智能，驅動AI探索未知之境。

Tags:

深度學習模型阿里

免責聲明: 本文所包含的觀點僅代表作者個人看法，不代表新火種的觀點。在新火種上獲取的所有信息均不應被視為投資建議。新火種對本文可能提及或鏈接的任何項目不表示認可。交易和投資涉及高風險，讀者在采取與本文內容相關的任何行動之前，請務必進行充分的盡職調查。最終的決策應該基于您自己的獨立判斷。新火種不對因依賴本文觀點而產生的任何金錢損失負任何責任。

最新全球模型榜單：阿里Qwen2.5-Max超DeepSeekV3！又一國產大模型海外出圈！

AI大模型加速落地，阿里云持續「滋養」

英偉達JimFan：復刻NLP的成功路，用通用模型開啟具身智能的GPT-3時刻

阿里云智能對話機器人英文名更名為Chatbot

百度千帆大模型平臺日均調用量超7億次

百度智能云：千帆大模型平臺日均調用量超7億次

熱門文章