OpenAI這次要open了,奧爾特曼所說的“開放權重模型”是什么?
《科創板日報》4月1日訊(編輯 朱凌)北京時間4月1日凌晨,OpenAI首席執行官薩姆·奧爾特曼(Sam Altman)在社交媒體X平臺宣布:OpenAI將在未來幾個月內發布一個“強大的帶有推理能力的全新開放權重(open-weight)模型”。
這是自2019年發布GPT-2以來,OpenAI時隔六年首次宣布新的開放模型計劃。
回顧過往,OpenAI雖然以“開放”命名,但自從GPT-3開始,逐步轉向封閉。尤其是ChatGPT問世后,OpenAI模型只能通過其自家平臺或者微軟Azure等合作伙伴訪問或使用API接口。用戶無法在自己的硬件上自行部署運行GPT-3、4、4o、4.5等,無法對它們進行修改或二次開發。
或許是隨著DeepSeek等開放模型迅速崛起,OpenAI壓力逐漸增大。
在今年2月1日的OpenAI o3-mini產品發布后,奧爾特曼公開承認DeepSeek削弱了OpenAI在AI領域的領先地位。
他認為,OpenAI在開源AI方面一直站在歷史的錯誤一邊,“我們需要想出一個不同的開源策略”。
并非完全開源模型
2月18日,奧爾特曼在X平臺上發起對OpenAI下一個開源項目的民意調查:是做一個雖然體積小、但仍需要GPU運行的o3-mini級別模型,還是做一個適配手機的輕量模型?
投票結果偏向前者,這也預示了這次開放模型可能是o3-mini級別模型。但從奧爾特曼發起投票時的措辭來看,不會直接是o3-mini,而是一個與o3-mini類似,但有所不同的模型。
即便是開放模型,OpenAI依舊會保留一些“秘方”——例如模型訓練數據、預訓練細節或者關鍵架構組件等。換句話說,這是一個開放權重模型,但不是一個完全開源的模型。
事實上,由于AI模型不僅包括代碼,還涉及數據、參數和權重等,開源模型的定義并不像開源軟件般清晰,目前尚未形成統一定義。
Linux基金會提出的模型開放性框架(MOF)把開放模型分為了三個逐步擴展的層級——第三級“開放模型”、第二級“開放工具”和第一級“開放科學”。
DeepSeek、Qwen2.5等模型只通過了MOF第三級評估,第三級“開放模型”開放范圍包括模型架構、模型參數(最終參數)、模型卡、數據卡、技術報告和評估結果,距離最開放的第一級“開放科學”仍有空間。
而OpenAI將發布的開放模型是否能達到第三級,目前還不得而知。
開放權重模型意味著什么?
奧爾特曼在X上表示,“我們希望與開發者深入探討如何最大化發揮其作用,我們很高興能將它打造為一個非常非常優秀的模型。”
他還透露,OpenAI將在舊金山、歐洲和亞太地區舉辦開發者活動,以收集反饋并提供早期原型試用機會。
奧爾特曼稱,很期待看到開發人員的成果,以及大公司和政府如何使用它來運行自己的模型。
這似乎表明,這次開放模型主要針對開發人員、企業和政府,而不是個人用戶。
開放模型可以本地部署,在特殊應用場景中具有更大的優勢。企業和政府可以在自己的服務器上運行開放模型,無需連接外網或接入云端算力,在本地處理數據,利用特定領域的數據進行訓練,能夠保護隱私,還可以擺脫對OpenAI平臺的依賴,避免云服務帶來的延遲、安全和成本問題,同時提供緊急情況下的快速響應。
而且,開放模型可控性和可審計性增強,開發者可以深入理解模型運行機制,更容易調試和調整策略。
此外,開發者可以基于自有數據對模型進行開放模型微調,開發專屬的垂直領域應用,構建衍生模型,甚至將其提煉為在智能手機等智能終端上就能單機運行起來的AI模型。
英偉達也推出了個人AI超級計算機,使企業和開發者能夠以相對較低的成本運行開放模型。
不過,對于普通個人用戶而言,能夠流暢運行開放模型的硬件成本仍然較高,云端模型依然具有更高的實用性,尤其在面對復雜任務時,云端模型在算力和易用性方面仍擁有明顯優勢。
- 免責聲明
- 本文所包含的觀點僅代表作者個人看法,不代表新火種的觀點。在新火種上獲取的所有信息均不應被視為投資建議。新火種對本文可能提及或鏈接的任何項目不表示認可。 交易和投資涉及高風險,讀者在采取與本文內容相關的任何行動之前,請務必進行充分的盡職調查。最終的決策應該基于您自己的獨立判斷。新火種不對因依賴本文觀點而產生的任何金錢損失負任何責任。