首頁 > AI資訊 > 最新資訊 > o1滿血版泄露!奧數題圖片推理手拿把掐,奧特曼上線劇透o2

o1滿血版泄露!奧數題圖片推理手拿把掐,奧特曼上線劇透o2

新火種    2024-11-04

o1滿血版泄露了!

沒想到,OpenAI還擱那兒“今年一定”呢,不少網友已經率先上手體驗到了(doge)。

事情是醬嬸的:有網友發現,OpenAI已經在ChatGPT官網上部署了完整版o1,大家伙兒還都能卡bug直接用!

o1滿血版泄露!奧數題圖片推理手拿把掐,奧特曼上線劇透o2

最初發現此事的網友,測試確認泄露模型具有奧特曼所說的圖像推理能力。

o1滿血版泄露!奧數題圖片推理手拿把掐,奧特曼上線劇透o2

△圖源:@legit_rumors

而日志也顯示該模型就是o1本模。

o1滿血版泄露!奧數題圖片推理手拿把掐,奧特曼上線劇透o2

于是,趕在OpenAI出手修復之前,網友們抓緊大玩特玩了一波——

滿血o1到底有多牛

和已經發布的o1-preview、o1-mini最直觀的不同是,泄露出來的o1支持上傳附件。

這也就意味著,終于能測測o1的多模態能力了。

網友們也不說廢話,直接上強度,普特南數學競賽的證明題截圖一貼,甩給滿血o1。

o1滿血版泄露!奧數題圖片推理手拿把掐,奧特曼上線劇透o2

思考了18秒之后,o1給出答案:18。

o1滿血版泄露!奧數題圖片推理手拿把掐,奧特曼上線劇透o2

答案正確:

o1滿血版泄露!奧數題圖片推理手拿把掐,奧特曼上線劇透o2

再來一道更復雜的,雖然在識圖上遇到了一點小問題,但還是穩穩做對了。

o1滿血版泄露!奧數題圖片推理手拿把掐,奧特曼上線劇透o2o1滿血版泄露!奧數題圖片推理手拿把掐,奧特曼上線劇透o2

在如此驚艷表現之下,似乎正確識別人類史上首張黑洞照片也不算什么了(doge)。

o1滿血版泄露!奧數題圖片推理手拿把掐,奧特曼上線劇透o2

不過嘛,也不是沒有翻車案例。比如,讓大模型數數圖里有多少個三角形。

o1滿血版泄露!奧數題圖片推理手拿把掐,奧特曼上線劇透o2

ID為anagh的網友,給泄露模型和GPT-4o做了個同屏對比。

4o速度很快,給出了錯誤答案19。

而滿血o1花了1分39秒,狂刷一堆token……給出了不同的錯誤答案:29。

正確答案是24。

o1滿血版泄露!奧數題圖片推理手拿把掐,奧特曼上線劇透o2

這個bug現在已經修復了。不過,有意思的是,這次模型泄露,持續了整整3個小時。

不小心還是故意的?

有網友犀利地點出,這事兒看上去不是“不小心”,而是“精心策劃”:

o1滿血版泄露!奧數題圖片推理手拿把掐,奧特曼上線劇透o2

不少網友贊同這樣的觀點:

o1滿血版泄露!奧數題圖片推理手拿把掐,奧特曼上線劇透o2

而由于一切看上去已經部署就緒,甚至有人猜測,o1完整版的正式上線時間就在未來一周之內。

o1滿血版泄露!奧數題圖片推理手拿把掐,奧特曼上線劇透o2

值得注意的是,就在這次泄露事件之后,奧特曼馬上在上開始了自己的表演:

o1滿血版泄露!奧數題圖片推理手拿把掐,奧特曼上線劇透o2

好家伙,都已經吹上o2的風了(還假裝上錯號……)。

o1滿血版泄露!奧數題圖片推理手拿把掐,奧特曼上線劇透o2

至于為什么是這個時間……

那不得趕在Anthropic發布Claude Haiku 3.5之前搞點事嘛(doge)。

o1滿血版泄露!奧數題圖片推理手拿把掐,奧特曼上線劇透o2

參考鏈接:[1]https://x.com/legit_rumors/status/1852625385801859321[2]https://x.com/koltregaskes/status/1852657291469709626[3]https://x.com/anaghnairr/status/1852668741751919016

— 完 —

Tags:
相關推薦
免責聲明
本文所包含的觀點僅代表作者個人看法,不代表新火種的觀點。在新火種上獲取的所有信息均不應被視為投資建議。新火種對本文可能提及或鏈接的任何項目不表示認可。 交易和投資涉及高風險,讀者在采取與本文內容相關的任何行動之前,請務必進行充分的盡職調查。最終的決策應該基于您自己的獨立判斷。新火種不對因依賴本文觀點而產生的任何金錢損失負任何責任。

熱門文章