首頁 > AI資訊 > 行業動態 > 小米開源首個推理大模型XiaomiMiMo:7B參數就超越OpenAIo1-mini

小米開源首個推理大模型XiaomiMiMo:7B參數就超越OpenAIo1-mini

新火種    2025-04-30

4月30日消息,小米官方今天正式宣布,開源首個為推理(Reasoning)而生的大模型——Xiaomi MiMo。

據介紹,Xiaomi MiMo在數學推理(AIME 24-25)和代碼競賽(LiveCodeBench v5)公開測評集上,MiMo僅用7B的參數規模,超越了OpenAI的閉源推理模型o1-mini和阿里Qwen更大規模的開源推理模型QwQ-32B-Preview。

小米開源首個推理大模型Xiaomi MiMo:7B參數就超越OpenAI o1-mini

官方表示,MiMo 推理能力的提升,由預訓練和后訓練階段中數據和算法等多層面的創新聯合驅動。包括:

預訓練:核心是讓模型見過更多推理模式

數據:著重挖掘富推理語料,并合成約200B tokens推理數據。

訓練:進行了三階段訓練,逐步提升訓練難度,總訓練25T tokens。

小米開源首個推理大模型Xiaomi MiMo:7B參數就超越OpenAI o1-mini

后訓練:核心是高效穩定的強化學習算法和框架

算法:提出 Test Difficulty Driven Reward 來緩解困難算法問題中的獎勵稀疏問題,并引入 Easy Data Re-Sampling 策略,以穩定RL訓練。

框架:設計了Seamless Rollout系統,使得RL訓練加速2.29倍,驗證加速1.96倍。

小米開源首個推理大模型Xiaomi MiMo:7B參數就超越OpenAI o1-mini

所有技術細節已經Open,見技術報告。

MiMo-7B全系列已開源MiMo-7B 已開源4個模型至HuggingFace。

小米開源首個推理大模型Xiaomi MiMo:7B參數就超越OpenAI o1-mini


Tags:
相關推薦
免責聲明
本文所包含的觀點僅代表作者個人看法,不代表新火種的觀點。在新火種上獲取的所有信息均不應被視為投資建議。新火種對本文可能提及或鏈接的任何項目不表示認可。 交易和投資涉及高風險,讀者在采取與本文內容相關的任何行動之前,請務必進行充分的盡職調查。最終的決策應該基于您自己的獨立判斷。新火種不對因依賴本文觀點而產生的任何金錢損失負任何責任。

熱門文章