首頁 > AI資訊 > 行業(yè)動態(tài) > 號稱博士生水準!OpenAI最新模型仍分不出9.11和9.8哪個大

號稱博士生水準!OpenAI最新模型仍分不出9.11和9.8哪個大

新火種    2024-09-14

9月14日消息,OpenAI推出了OpenAI o1預覽模型,官方宣稱推理能力更強,可達理科博士生水準。

按照官方技術(shù)博客說法,o1在推理能力上代表了人工智能最強的水平。同時官方放出了更多OpenAI o1的更多演示視頻。比如使用OpenAI o1來編寫一個找松鼠的網(wǎng)頁游戲。

這個游戲的目標是控制一只考拉躲避不斷增加的草莓,并在3秒后找到出現(xiàn)的松鼠。這類游戲的邏輯相對復雜,更考驗OpenAI o1的邏輯推理能力。

號稱博士生水準!OpenAI最新模型仍分不出9.11和9.8哪個大

官方還表示,相較于GPT-4o等現(xiàn)有的大模型,OpenAI o1能夠解決更加困難的推理問題,同時改善過往模型中存在的機制性缺陷。

比如在解答編程問題時也會更有條理,在著手寫代碼前,把整個回答的流程全部思考完一遍,再動手輸出代碼。

不過,經(jīng)過實測,OpenAI o1依然無法解決“9.11和9.8哪個大”的經(jīng)典難題,嚴重扣分。

因為9.11和9.8哪個大這個問題,之前AI大模型集體失智,所以....

號稱博士生水準!OpenAI最新模型仍分不出9.11和9.8哪個大

相關推薦
免責聲明
本文所包含的觀點僅代表作者個人看法,不代表新火種的觀點。在新火種上獲取的所有信息均不應被視為投資建議。新火種對本文可能提及或鏈接的任何項目不表示認可。 交易和投資涉及高風險,讀者在采取與本文內(nèi)容相關的任何行動之前,請務必進行充分的盡職調(diào)查。最終的決策應該基于您自己的獨立判斷。新火種不對因依賴本文觀點而產(chǎn)生的任何金錢損失負任何責任。

熱門文章