亚洲欧洲精品一区二区,99视频在线免费观看,永久久久免费人妻精品

首頁 > AI資訊 > 最新資訊 > 性能比肩DeepSeek，阿里開源最新推理模型發(fā)布即爆火

性能比肩DeepSeek，阿里開源最新推理模型發(fā)布即爆火

南方都市報 2025-03-07

　　阿里再度推進開源進程。3月6日，阿里凌晨發(fā)布并開源通義千問推理模型QwQ-32B。據悉，千問QwQ-32B在數學、代碼及通用能力上實現(xiàn)質的飛躍，用更小參數實現(xiàn)整體性能比肩DeepSeek-R1，并突破性地讓高性能推理模型在消費級顯卡上實現(xiàn)本地部署，大幅降低了模型應用成本。隨后，千問推理模型QwQ-32B迅速登頂全球最大的AI開源社區(qū)Hugging Face大模型榜單。

　　據悉，阿里還在推理模型中集成了與Agent相關的能力，使其能夠在使用工具的同時進行批判性思考，并根據環(huán)境反饋調整推理過程。同時，阿里還開展了大規(guī)模強化學習。“在初始階段，特別針對數學和編程任務進行了大規(guī)模強化學習訓練。與依賴傳統(tǒng)的獎勵模型（reward model）不同，我們通過校驗生成答案的正確性來為數學問題提供反饋，并通過代碼執(zhí)行服務器評估生成的代碼是否成功通過測試用例來提供代碼的反饋。”通義千問團隊稱。

　　最近，針對開源阿里方面動作頻頻。就在2月25日晚，阿里云深夜搶先開源旗下視覺生成基座模型萬相2.1（Wan）。阿里云該開源產品采用最寬松的Apache2.0協(xié)議，14B和1.3B兩個參數規(guī)格的全部推理代碼和權重全部開源，同時支持文生視頻和圖生視頻任務，在權威測評中，萬相2.1也已經超越了Sora、Luma、Pika等國內外模型。

　　另外在2月25日日間，阿里Qwen團隊在社交媒體宣布發(fā)布新推理模型——深度思考(QwQ)。據介紹，該新推理模型基于Qwen2.5-Max的推理模型，目前的模型為預覽版，已具有很強的數學理解、編碼、代理等能力，目前支持有深度思考（QWQ）和聯(lián)網搜索，同時布局了多模態(tài)能力，能根據提示語句生成圖片。

　　自2023年8月起，阿里云相繼開源Qwen、Qwen1.5、Qwen2等多代模型，囊括了0.5B、1.5B、3B、7B、14B、32B、72B、110B等全尺寸，大語言、多模態(tài)、數學和代碼等全模態(tài)。根據全球最大AI開源社區(qū)Hugging Face信息，截至目前，阿里千問（Qwen）開源大模型的衍生模型數量已突破10萬。

（文章來源：南方都市報）

Tags:

強化學習阿里模型

免責聲明: 本文所包含的觀點僅代表作者個人看法，不代表新火種的觀點。在新火種上獲取的所有信息均不應被視為投資建議。新火種對本文可能提及或鏈接的任何項目不表示認可。交易和投資涉及高風險，讀者在采取與本文內容相關的任何行動之前，請務必進行充分的盡職調查。最終的決策應該基于您自己的獨立判斷。新火種不對因依賴本文觀點而產生的任何金錢損失負任何責任。

性能比肩DeepSeek，阿里開源最新推理模型發(fā)布即爆火

光伏發(fā)電成本大幅下降，首航新能強化研發(fā)力促新能源變革

盧偉冰稱小米將持續(xù)加大對平板投入強化中高端產品線

學習新語丨總書記擘畫新時代東北全面振興

寶駿享境實車裝載DeepSeek大模型

齊心數字化運營平臺接入DeepSeek大模型

熱門文章