OpenAI的巨變如此悄悄的來了,AI大模型開啟推理新時代
在人工智能的歷史上,2024年9月12日或許將被銘記為一個歷史性轉折點。就在這一天,OpenAI宣布了其最新系列AI模型——o1。據官方稱,o1是史上最聰明的模型,思考方式也更接近人類,標志著人類正在通往推理時代的新道路。
o1模型的核心在于其推理能力。與基于預測的模型不同,o1在回答問題之前會進行深入的思考,探索不同的路徑直到找到最佳答案。
這種能力使得o1能夠在給定更多的“思考”時間時,回答更難的問題,類似于在國際象棋比賽中關鍵時刻考慮可能的走法。這種推理能力是AI發展的一大步,它使得AI能夠在更廣泛的領域中應用,包括但不限于編程、數學和科學問題。
普通用戶在日常使用中可能難以察覺o1模型與GPT系列之間的微妙差異,但對于深入研究AI技術的研究人員而言,這一變化卻是革命性的。
據《The Atlantic》上周文章,研究人員已經認識到,與GPT等舊模型相比,o1模型不僅僅是一次簡單的升級,而是標志著一個“完全不同的游戲規則”和“真正的進步”。作為第一個具備真正通用推理能力的大模型,o1模型在處理復雜問題和推理任務時展現出的能力,或預示著人工智能技術的一個歷史性轉折點。
OpenAI研究副總裁Mark Chen今年早前指出,o1與標準 ChatGPT 有著根本的不同,因為它可以“推理”,這是人類智能的標志。此后不久,OpenAI首席執行官Altman宣布“智能時代即將到來”,人工智能將幫助人類解決氣候問題并殖民太空。上周,這家初創公司向公眾發布了具有完全成熟推理能力的o1完整的第一代版本。
第一個具備真正通用推理能力的大模型OpenAI稱,o1模型是第一個具備真正通用推理能力的大模型,這一點在測試化學、物理和生物學專業知識的基準GPQA-diamond上得到了充分體現。
根據OpenAI的評估,o1在該測試中全面超過了人類博士專家,準確率達到78.3%,而人類專家的得分為69.7%。OpenAI稱,“通用人工智能(AGI)之路,已經沒有任何阻礙”。
此外,o1在多個高難度的推理基準測試中表現優異,例如在美國數學邀請賽(AIME)中,o1的正確率達到了83.3%,遠超其前身GPT-4o的表現。
o1模型的推出,也使得國內外的AI企業開始密切關注彼此的動態,意圖在AI大模型領域實現突破。市場涌現出一批新興的大模型,如kimi的k0math、Deepseek的DeepSeek-R1-Lite和昆侖萬維的“天工大模型4.0”o1版,它們在邏輯思維與深度推理的能力上,試圖與o1抗衡。
- 免責聲明
- 本文所包含的觀點僅代表作者個人看法,不代表新火種的觀點。在新火種上獲取的所有信息均不應被視為投資建議。新火種對本文可能提及或鏈接的任何項目不表示認可。 交易和投資涉及高風險,讀者在采取與本文內容相關的任何行動之前,請務必進行充分的盡職調查。最終的決策應該基于您自己的獨立判斷。新火種不對因依賴本文觀點而產生的任何金錢損失負任何責任。