性能比肩DeepSeek,阿里開源最新推理模型發(fā)布即爆火
阿里再度推進開源進程。3月6日,阿里凌晨發(fā)布并開源通義千問推理模型QwQ-32B。據悉,千問QwQ-32B在數學、代碼及通用能力上實現(xiàn)質的飛躍,用更小參數實現(xiàn)整體性能比肩DeepSeek-R1,并突破性地讓高性能推理模型在消費級顯卡上實現(xiàn)本地部署,大幅降低了模型應用成本。隨后,千問推理模型QwQ-32B迅速登頂全球最大的AI開源社區(qū)Hugging Face大模型榜單。
據悉,阿里還在推理模型中集成了與Agent相關的能力,使其能夠在使用工具的同時進行批判性思考,并根據環(huán)境反饋調整推理過程。同時,阿里還開展了大規(guī)模強化學習。“在初始階段,特別針對數學和編程任務進行了大規(guī)模強化學習訓練。與依賴傳統(tǒng)的獎勵模型(reward model)不同,我們通過校驗生成答案的正確性來為數學問題提供反饋,并通過代碼執(zhí)行服務器評估生成的代碼是否成功通過測試用例來提供代碼的反饋。”通義千問團隊稱。
最近,針對開源阿里方面動作頻頻。就在2月25日晚,阿里云深夜搶先開源旗下視覺生成基座模型萬相2.1(Wan)。阿里云該開源產品采用最寬松的Apache2.0協(xié)議,14B和1.3B兩個參數規(guī)格的全部推理代碼和權重全部開源,同時支持文生視頻和圖生視頻任務,在權威測評中,萬相2.1也已經超越了Sora、Luma、Pika等國內外模型。
另外在2月25日日間,阿里Qwen團隊在社交媒體宣布發(fā)布新推理模型——深度思考(QwQ)。據介紹,該新推理模型基于Qwen2.5-Max的推理模型,目前的模型為預覽版,已具有很強的數學理解、編碼、代理等能力,目前支持有深度思考(QWQ)和聯(lián)網搜索,同時布局了多模態(tài)能力,能根據提示語句生成圖片。
自2023年8月起,阿里云相繼開源Qwen、Qwen1.5、Qwen2等多代模型,囊括了0.5B、1.5B、3B、7B、14B、32B、72B、110B等全尺寸,大語言、多模態(tài)、數學和代碼等全模態(tài)。根據全球最大AI開源社區(qū)Hugging Face信息,截至目前,阿里千問(Qwen)開源大模型的衍生模型數量已突破10萬。
(文章來源:南方都市報)
- 免責聲明
- 本文所包含的觀點僅代表作者個人看法,不代表新火種的觀點。在新火種上獲取的所有信息均不應被視為投資建議。新火種對本文可能提及或鏈接的任何項目不表示認可。 交易和投資涉及高風險,讀者在采取與本文內容相關的任何行動之前,請務必進行充分的盡職調查。最終的決策應該基于您自己的獨立判斷。新火種不對因依賴本文觀點而產生的任何金錢損失負任何責任。