精品国产一区二区三区不卡蜜臂 ,欧美成人jazz,成人a免费

首頁 > AI資訊 > 行業動態 > DeepSeek版o1炸場，數學代碼超越OpenAI，每天免費玩50次，后續將開源

DeepSeek版o1炸場，數學代碼超越OpenAI，每天免費玩50次，后續將開源

新火種 2024-11-22

DeepSeek版o1來了，發布即上線，現在就能玩！

模型名為DeepSeek-R1-Lite，預覽版在難度較高數學和代碼任務上超越o1-preview，大幅領先GPT-4o等。

據了解，DeepSeek-R1-Lite使用強化學習訓練，推理含大量反思和驗證，遵循新的Scaling Laws——

推理越長，表現更強。

如下展示，在AIME測試基準中，隨著計算時間增加，其得分穩步提升。

值得一提的是，官方還表示，目前模型仍在開發階段，經持續迭代，正式版DeepSeek-R1模型將完全開源，包括公開技術報告并提供API。

這下網友們紛紛坐不住，已齊刷刷碼住開始實測了。

網友實測在此

登錄官方網頁，打開深度思考按鈕，就能體驗DeepSeek-R1-Lite預覽版。

每天有默認50次的免費使用。

下面這位小哥讓模型破解如下密碼：

沒成想OpenAI o1-preview在這個測試中答錯了（3289），而DeepSeek-R1-Lite-Preview推理正確，直接給出了正確答案3841。

還有網友來了個系統性測試，一通體驗后感覺是：

這位網友最后還補充道：

除此之外，也有網友在測試中發現，模型玩井字棋（tic tac toe）還是不太行。

不過，有網友反饋現在的一些新模型能夠穩定地玩這個游戲，但不能在第一次嘗試時就成功。

好了，感興趣的童鞋趕緊自己實測一波吧～

官網：

參考鏈接：

Tags:

數學代碼

2024-11-22

2024-11-19

2024-11-17

2024-11-16

2024-11-15

免責聲明: 本文所包含的觀點僅代表作者個人看法，不代表新火種的觀點。在新火種上獲取的所有信息均不應被視為投資建議。新火種對本文可能提及或鏈接的任何項目不表示認可。交易和投資涉及高風險，讀者在采取與本文內容相關的任何行動之前，請務必進行充分的盡職調查。最終的決策應該基于您自己的獨立判斷。新火種不對因依賴本文觀點而產生的任何金錢損失負任何責任。