首頁 > AI資訊 > 行業動態 > DeepSeek版o1炸場,數學代碼超越OpenAI,每天免費玩50次,后續將開源

DeepSeek版o1炸場,數學代碼超越OpenAI,每天免費玩50次,后續將開源

新火種    2024-11-22

DeepSeek版o1來了,發布即上線,現在就能玩!

DeepSeek版o1炸場,數學代碼超越OpenAI,每天免費玩50次,后續將開源

模型名為DeepSeek-R1-Lite,預覽版在難度較高數學和代碼任務上超越o1-preview,大幅領先GPT-4o等。

DeepSeek版o1炸場,數學代碼超越OpenAI,每天免費玩50次,后續將開源

據了解,DeepSeek-R1-Lite使用強化學習訓練,推理含大量反思和驗證,遵循新的Scaling Laws——

推理越長,表現更強。

如下展示,在AIME測試基準中,隨著計算時間增加,其得分穩步提升。

DeepSeek版o1炸場,數學代碼超越OpenAI,每天免費玩50次,后續將開源

值得一提的是,官方還表示,目前模型仍在開發階段,經持續迭代,正式版DeepSeek-R1模型將完全開源,包括公開技術報告并提供API。

DeepSeek版o1炸場,數學代碼超越OpenAI,每天免費玩50次,后續將開源

這下網友們紛紛坐不住,已齊刷刷碼住開始實測了。

網友實測在此

登錄官方網頁,打開深度思考按鈕,就能體驗DeepSeek-R1-Lite預覽版。

每天有默認50次的免費使用。

DeepSeek版o1炸場,數學代碼超越OpenAI,每天免費玩50次,后續將開源

下面這位小哥讓模型破解如下密碼:

DeepSeek版o1炸場,數學代碼超越OpenAI,每天免費玩50次,后續將開源

沒成想OpenAI o1-preview在這個測試中答錯了(3289),而DeepSeek-R1-Lite-Preview推理正確,直接給出了正確答案3841。

DeepSeek版o1炸場,數學代碼超越OpenAI,每天免費玩50次,后續將開源

還有網友來了個系統性測試,一通體驗后感覺是:

DeepSeek版o1炸場,數學代碼超越OpenAI,每天免費玩50次,后續將開源

這位網友最后還補充道:

除此之外,也有網友在測試中發現,模型玩井字棋(tic tac toe)還是不太行。

DeepSeek版o1炸場,數學代碼超越OpenAI,每天免費玩50次,后續將開源DeepSeek版o1炸場,數學代碼超越OpenAI,每天免費玩50次,后續將開源

不過,有網友反饋現在的一些新模型能夠穩定地玩這個游戲,但不能在第一次嘗試時就成功。

DeepSeek版o1炸場,數學代碼超越OpenAI,每天免費玩50次,后續將開源

好了,感興趣的童鞋趕緊自己實測一波吧~

官網:

參考鏈接:

Tags:
相關推薦
免責聲明
本文所包含的觀點僅代表作者個人看法,不代表新火種的觀點。在新火種上獲取的所有信息均不應被視為投資建議。新火種對本文可能提及或鏈接的任何項目不表示認可。 交易和投資涉及高風險,讀者在采取與本文內容相關的任何行動之前,請務必進行充分的盡職調查。最終的決策應該基于您自己的獨立判斷。新火種不對因依賴本文觀點而產生的任何金錢損失負任何責任。

熱門文章