OpenAI展示o1模型:能同時輸入圖文pro版價格創新高
一位熱力學專業的博士手繪了一張“太空AI數據中心”草圖,但不知道散熱板要建多大,于是他把草圖和問題一起輸入進ChatGPT。10秒鐘后,“正式版”o1模型給出了回復:242萬平方米。這名博士補充道:“這大概是2%舊金山土地的面積?!痹谒赃?,OpenAI創始人、CEO山姆·奧特曼歪了歪頭,“看上去還行?!?/p>
這是北京時間12月6日凌晨,OpenAI一場直播上山姆·奧特曼和OpenAI公司研究員的互動內容,從這天起,OpenAI將連續12個工作日進行直播,展示新發布內容。在第一場直播上,OpenAI展示了正式版o1模型的各項新晉能力:支持圖片+文字同時輸入、更快地響應時間、針對難度不同的問題給出不同的響應速度等。
值得注意的是,本次OpenAI還推出了比o1能力更強的o1“pro”版模型,該模型收費高達200美元/月,創造了大模型月付費的新高。
OpenAI創始人、CEO山姆·奧特曼與公司研究員一起直播。圖/OpenAI官網
O1模型從預覽版正式“轉正” 思考速度提升響應更快
今年9月,OpenAI發布了o1系列模型的預覽版“o1-preview”,而本次直播,o1正式“轉正”。據介紹,該模型改進了推理和邏輯能力,能夠提高回答的準確性和實用性。
在奧特曼展示的能力對比圖中,o1模型解答美國數學競賽試題的準確率達到83.3%,相比之下預覽版準確率為56.7%,gpt4o的準確率則只有13.4%。編碼能力上o1模型與gtp4o的差距更是拉大到了89分與11分。差距相對較小的則是在解決博士級別科研問題上,o1的準確率反而比o1預覽版略低,二者分別為78%與78.3%,相比之下gpt4o的準確率為56.1%,而人類專家的準確率是69.7%。
o1與o1預覽版、gtp4o在計算、編碼、回答博士級別問題的表現對比。圖/OpenAI官網
此前,o1模型預覽版在用戶試用時總被詬病的一點是模型回答問題的準確率雖然有所提升,但響應時間慢了很多。對此,奧特曼表示o1模型將可以更迅速地回答簡單問題,只在面對復雜問題時需要較長的響應時間。
同時,對于復雜問題的響應速度,o1模型也比o1預覽版大大加快。在演示中,研究人員向o1模型提了一個問題:列出羅馬帝國在公元2世紀的統治者,包含其在位時間和成就。o1模型花了將近18秒來回答這個問題,雖然仍比gtp4o低,但比o1預覽版的速度提高了約60%。
此外,o1還引入了多模態能力,如上文提到的,OpenAI一名擁有熱力學博士學位的亞裔研究員通過向o1模型中輸入手繪草圖+文字提問的方式,獲得了“在太空建設數據中心如何散熱”這一問題的回答。貝殼財經記者注意到,o1模型在回答該科學問題時,不僅詳細列出了思考步驟,還在回答中列出了計算公式。
o1-Pro費用每月訂閱費用200美元
值得注意的是,就像蘋果、華為等推出旗艦手機時往往還會推出一個“pro”版本,本次奧特曼也不僅介紹了o1正式版模型,還介紹了該模型的“pro”加強版本,并直言pro版本o1模型的訂閱費用為每月200美元。
奧特曼表示,o1模型是“世界上最智能的語言模型”,除了o1“pro”版本,他在列出的一項數據中表示,o1-pro模型對博士水平科學問題的解答準確率為79.3%,解答美國數學競賽試題的準確率則為85.8%,已經超越了o1模型。
根據OpenAI提供的資料,o1-pro模型最大的亮點在于其推理的可靠性,模型對每個問題都將進行四次嘗試,只有四次嘗試都正確,才會認為一個問題已經解決。
目前,用戶已經可以在ChatGPT的套餐中選擇o1模型,價格為每月20美元,而pro版本是該價格的十倍。對此,有不少網友吐槽“誰能用得起這么貴的模型?!?/p>
對此,奧特曼于直播后在個人社交平臺回應,“一小部分用戶希望頻繁使用 ChatGPT,甚至達到了使用頻率限制,他們希望支付更多費用來解決真正復雜的問題。每月200美元的訂閱等級非常適合他們。”
(文章來源:新京報)
- 免責聲明
- 本文所包含的觀點僅代表作者個人看法,不代表新火種的觀點。在新火種上獲取的所有信息均不應被視為投資建議。新火種對本文可能提及或鏈接的任何項目不表示認可。 交易和投資涉及高風險,讀者在采取與本文內容相關的任何行動之前,請務必進行充分的盡職調查。最終的決策應該基于您自己的獨立判斷。新火種不對因依賴本文觀點而產生的任何金錢損失負任何責任。