首頁 > AI資訊 > 最新資訊 > 反超DeepSeek!新版GPT-4o登頂競技場,奧特曼:還會更好

反超DeepSeek!新版GPT-4o登頂競技場,奧特曼:還會更好

新火種    2025-02-18

GPT-4o悄悄更新版本,在大模型競技場超越DeepSeek-R1登上并列第一。

除了數學(第6),還在多個單項上拿下第一:

創意寫作;編程;指令遵循;長文本查詢;多輪對話;

先直觀看下新版GPT-4o的能力如何,還是以之前DeepSeek-R1和o3-mini都挑戰過的一個例子來看。

之前是醬紫的:

而新版GPT-4o看起來又雙叒進化了:

從網友測試反饋來看,新版GPT-4o不僅更“聰明”了,而且最重要的是更加具有“個性”了。

而這也收獲了大神卡帕西的連連稱贊:

與此同時,還有網友趁機扒出了ChatGPT最新系統提示詞??

新版GPT-4o更有個性了

關于GPT-4o已更新的消息,OpenAI CEO奧特曼在發帖認領的同時還評價道:

在網友的進一步追問中,他將其定義為“全網最佳搜索產品”。

結合網友們的花式體驗,目前新版GPT-4o在能力和個性上均有一定程度升級。

最明顯的,當屬回復時的語氣更擬人化了,時不時還會用一些表情包。

當被問及AI是否擁有人類情感時,一位日本小哥驚嘆道,它不僅全篇用“我”作為主語,而且在爭論中承認了擁有情感的可能性。

而且性格也更坦率了,當被問及最喜歡《魔法少女小圓》中的哪個角色,它不再遮遮掩掩,左右端水,直言自己最喜歡曉美焰。

甚至有時候還會升級成“spicey”,不但大膽吐槽“主人”OpenAI過于限制模型使用。

連奧特曼也不能幸免,也被蓋章為“兩面三刀”。(doge)

最令網友震驚的是,它還能“盲猜”用戶的心理和一些思想觀念了。

用下面這段相同提示詞就可以嘗試:

有人立馬嘗試了,并收獲了同款震驚,真·肚子里的蛔蟲。

按照相關解釋,這是因為新版GPT-4o能夠根據用戶過去的討論和對話歷史,做出不同行為。

除此之外,還有網友腦洞大開,讓新GPT-4o和Claude相互吵架,結果把Claude干崩潰了!

另一方面,從任務完成情況來看,“拒絕請求的可能性也更小了”。

當用戶咨詢如何在組織內部署AI時,它先是自己想了10個方案,然后又借助聯網搜索提供了另外10個。

不過……該網友反饋新GPT-4o似乎無法和自定義GPTs兼容。

針對這一情況,另有人補充這可能是因為它始終默認網絡搜索,只要手動關閉或將關閉作為系統提示詞即可。

同時,它也在編寫Vue.js上更出色了。

從另一個它和DeepSeek-R1和o3-mini的同臺競技中(玩《我的世界》),也能看出其能力升級。

OMT:ChatGPT最新提示詞泄露

然鵝,當被問到“你屬于哪個模型?”這個經典問題,一些混亂又出現了。

大多數情況下,它會問答自己是GPT-4:

不過據一些Pro用戶反饋,它聲稱自己是GPT-4.5。

鑒于奧特曼上周剛宣布將在未來幾周內發布GPT-4.5,有人據此推測很可能這里有早期測試。

對于這個問題,有人直接扒了ChatGPT最新系統提示詞。

最后,既然說到GPT-4o更個性化了,眾人也紛紛cue到了將在明天(北京時間周二12:00)發布的Grok-3。

坐等這兩個AI吵起來(等待吃瓜)~

相關推薦
免責聲明
本文所包含的觀點僅代表作者個人看法,不代表新火種的觀點。在新火種上獲取的所有信息均不應被視為投資建議。新火種對本文可能提及或鏈接的任何項目不表示認可。 交易和投資涉及高風險,讀者在采取與本文內容相關的任何行動之前,請務必進行充分的盡職調查。最終的決策應該基于您自己的獨立判斷。新火種不對因依賴本文觀點而產生的任何金錢損失負任何責任。

熱門文章