首頁 > AI資訊 > 最新資訊 > 滬研大模型捷報頻傳階躍星辰自研推理模型StepR-mini今上線

滬研大模型捷報頻傳階躍星辰自研推理模型StepR-mini今上線

上觀新聞    2025-01-17

  這幾天,滬研滬產大模型捷報頻傳。繼15日上海人工智能實驗室對“書生”大模型進行重要版本升級,MiniMax發布并開源新一代01系列模型后,階躍星辰自研推理模型Step Reasoner mini(簡稱“Step R-mini”)今天上線。

  Step Reasoner mini是Step系列模型家族的首個推理模型,擅長主動進行規劃、嘗試和反思,能通過慢思考和反復驗證的邏輯機制,為用戶提供準確可靠的回復。它既擅長通過超長推理能力,解決邏輯推理、代碼和數學等復雜問題,也能兼顧文學創作等通用領域。

  記者了解到,目前大部分推理模型難以兼顧文理科雙方向能力——隨著訓練參數規模增加,模型的文科能力會得到提升,但也會因此損失確定性,造成理工科能力的下滑。Step Reasoner mini通過大規模的強化學習訓練,并使用同策略強化學習算法,實現了“文理兼修”。Step Reasoner mini除了能準確解答數學、代碼、邏輯推理問題,還能富有創意地完成文學內容創作和日常聊天的任務。

  例如,在解答“連續整數之和為1000的共有幾組”這道題時,Step Reasoner mini展現了全面和嚴謹的思維鏈路:先分析用戶題目需求,然后選擇出最佳的解題公式,在得到初步答案后,它通過多次自我追問確定是否有沒被考慮到的因素。

  而在處理邏輯推理任務時,Step Reasoner mini會自主進行多種解題思路的嘗試,在得到初步答案后,會自我反問嘗試有沒有其他可能性,確保枚舉出所有效果良好的解決方案,并在交卷前檢查有無遺漏。

  當接到創作類題目的任務,Step Reasoner mini能夠深入理解用戶的表達需求,是個“追求完美”的創作者。它會先分析用戶對創作主題、文學題材的要求,然后思考處理創作角度、描繪的景物、修辭手法、內容結構,賦予事物人類情感層面的象征意義,并增加個性化的、創新的表達風格。

  記者獲悉,階躍星辰自研的Step系列基座模型矩陣,目前已經覆蓋了從語言、多模態到推理的全面能力。

(文章來源:上觀新聞)

相關推薦
免責聲明
本文所包含的觀點僅代表作者個人看法,不代表新火種的觀點。在新火種上獲取的所有信息均不應被視為投資建議。新火種對本文可能提及或鏈接的任何項目不表示認可。 交易和投資涉及高風險,讀者在采取與本文內容相關的任何行動之前,請務必進行充分的盡職調查。最終的決策應該基于您自己的獨立判斷。新火種不對因依賴本文觀點而產生的任何金錢損失負任何責任。

熱門文章