關注o1必備GitHub倉庫,上線3天狂攬1.5k星!英偉達工程師出品!
關注o1必備的GitHub庫,它來了!
上線3天狂攬1.5k星,一躍登上GitHub趨勢榜!
這個庫專注于收集與o1相關的推理技術論文、博客和項目等資源,供大家研究討論,并在持續更新中。

網友們對它給予高度評價:
科技大V說它是“拆解草莓的逆向工程”。

也有網友直接提出表揚:“研究o1,看它就夠了!”

真有這么牛?咱們一起來看看到底怎么個事兒!
干貨滿滿在這個名為Awesome-LLM-Strawberry的GitHub庫中,涵蓋了大量關于o1的信息。
新火種為大家整理了一下迄今為止發布的相關硬核內容:
關于o1的博客博客:Learning to Reason with LLMs作者:OpenAI鏈接:https://openai.com/index/learning-to-reason-with-llms/
概述:這篇博客介紹了OpenAI o1的訓練方法,其中包括鏈式推理、自我批評、驗證、多步驟推理、任務分解和蒙特卡洛樹搜索等技術。

博客:OpenAI o1-mini作者:OpenAI鏈接:https://openai.com/index/openai-o1-mini-advancing-cost-efficient-reasoning/
概述:介紹了o1 mini模型在推理成本和效率方面的改進,在保持高推理性能的同時,顯著降低了計算和運行成本。

博客:Finding GPT-4’s mistakes with GPT-4作者:OpenAI鏈接:https://openai.com/index/finding-gpt4s-mistakes-with-gpt-4/
概述:討論了如何利用GPT-4模型自身來發現和修正生成的錯誤。文章中提到的“自我審查方法”通過雙重評估提高了錯誤檢測的準確性,從而讓模型輸出的內容變得更加可靠。(文章發表時,已有OpenAI超級對齊團隊成員離職,因此也被稱為團隊的“遺作”)

博客:Summary of what we have learned during AMA hour with the OpenAI o1 team作者:Tibor Blaho鏈接:https://twitter-thread.com/t/1834686946846597281
- 免責聲明
- 本文所包含的觀點僅代表作者個人看法,不代表新火種的觀點。在新火種上獲取的所有信息均不應被視為投資建議。新火種對本文可能提及或鏈接的任何項目不表示認可。 交易和投資涉及高風險,讀者在采取與本文內容相關的任何行動之前,請務必進行充分的盡職調查。最終的決策應該基于您自己的獨立判斷。新火種不對因依賴本文觀點而產生的任何金錢損失負任何責任。