首頁 > AI資訊 > 行業動態 > OpenAI智能體新線索曝光!網友:新ChatGPT時刻要來了

OpenAI智能體新線索曝光!網友:新ChatGPT時刻要來了

新火種    2025-01-22

沒錯,OpenAI的智能體時代真的要來了!

據大名鼎鼎的“情報員”光頭哥爆料,OpenAI在MAC版ChatGPT桌面應用中隱藏了啟用/禁用智能體的選項。

從截圖來看,確實是傳聞已久、代號為“Operator(操作員)”的辣個:

OpenAI智能體新線索曝光!網友:新ChatGPT時刻要來了

而且這則爆料也得到了日常關注蘋果方面消息的博主@M1的再次佐證:

OpenAI智能體新線索曝光!網友:新ChatGPT時刻要來了

根據介紹,Operator能夠接管用戶PC,直接代替人類自主執行一系列操作(如編碼開發應用、訂餐,做攻略等等)。

OpenAI智能體新線索曝光!網友:新ChatGPT時刻要來了

與此同時,OpenAI智能體和其他競爭對手(如Anthropic、谷歌智能體),以及人類選手的跑分對比也曝光了。

先劃個重點,在幾個評估智能體執行自動化任務水平的基準測試中,OpenAI這邊均戰勝了Claude智能體。

OpenAI智能體新線索曝光!網友:新ChatGPT時刻要來了

網友們紛紛激動表示,看起來離發布已經很近了,或許又會是下一個ChatGPT時刻。

OpenAI智能體新線索曝光!網友:新ChatGPT時刻要來了OpenAI智能體新線索曝光!網友:新ChatGPT時刻要來了

而Windows用戶則開啟了刷屏模式,請不要僅限于Mac、請不要僅限于Mac、請不要僅限于Mac……(OpenAI你聽到了嗎)

OpenAI智能體新線索曝光!網友:新ChatGPT時刻要來了多個基準跑分超過Claude智能體

從光頭哥的另一條推文里,我們看到了OpenAI智能體和其他競品的詳細對比。

OpenAI智能體新線索曝光!網友:新ChatGPT時刻要來了

相關數據來自OpenAI網站,具體為圖中標黃部分。

OpenAI智能體新線索曝光!網友:新ChatGPT時刻要來了

單拉出來看,在OSWorld這個專為多模態Agent設置的基準測試中,OpenAI CUA(據推測可能是驅動Operator的AI模型)得分為38.1%,領先于Anthropic的Computer use功能,但還不及人類自己操作的一半水平。

類似情況也在WebArena(CMU發布的基于Web環境的基準測試)上演。

不過,在WebVoyager(由騰訊AI Lab發布的多模態網絡Agent基準測試)則稍有反轉,OpenAI CUA取得了87%的好成績,不僅一如既往地領先Anthropic,還以小幅優勢超過了人類(85.3%)。

OpenAI智能體新線索曝光!網友:新ChatGPT時刻要來了

從一些具體任務的完成通過率來看,有輔助的Operator表現好過完全自主操作,不過偶爾還是比不上帶視覺能力的GPT-4o。

OpenAI智能體新線索曝光!網友:新ChatGPT時刻要來了

有網友據此提問Operator是否不如GPT-4o,對此另有熱心網友指出了二者區別:

OpenAI智能體新線索曝光!網友:新ChatGPT時刻要來了

另外,對二者安全性的評估如下,GPT-4o在拒絕非法宣傳、極端活動討論等方面均為100%,而Operator在越獄(Jailbreaks)、進行非法活動以及禁止的金融活動方面沒有達到100%。

OpenAI智能體新線索曝光!網友:新ChatGPT時刻要來了

需要提醒的是,在光頭哥看來,以上跑分也可能只是占位符,具體真實性無法保證。(先來個免責聲明)

OpenAI智能體新線索曝光!網友:新ChatGPT時刻要來了2025:OpenAI重點布局Agent

事實上,Operator這款智能體早在去年11月就有相關爆料。

當時彭博社聲稱,OpenAI將在明年1月推出它,來替用戶自動執行任務。

OpenAI智能體新線索曝光!網友:新ChatGPT時刻要來了

而現在,也算是進一步佐證了之前的消息。

甚至就在去年底,OpenAI CEO奧特曼也在新年目標中,明晃晃地將Agent排在前列。

OpenAI智能體新線索曝光!網友:新ChatGPT時刻要來了

而Flag立完后,OpenAI剛一開年也是馬不停蹄地開始了相關動作。

上周,OpenAI就為ChatGPT推出了新功能「Tasks」,讓AI有了執行力,可以替你完成各種任務。

OpenAI智能體新線索曝光!網友:新ChatGPT時刻要來了

整體看起來有點偏向日程提醒,更像Agent的初級階段。

合理推測,Operator將在此基礎上有更多、更強的能力表現。

OpenAI智能體新線索曝光!網友:新ChatGPT時刻要來了

話說,從國內外科技企業對Agent的新追逐來看,今年Agent絕對有好戲看!

據市場研究公司Markets and Markets的分析,AI Agent的市場規模至2030年有望達到471億美元。

如此吸引下,再加上已經成熟的大模型技術,Agent火爆2025簡直不言而喻。

甚至就在今年的CES上,英偉達CEO黃仁勛也對Agent大加贊賞:

OpenAI智能體新線索曝光!網友:新ChatGPT時刻要來了

此番言論下,了解AI Agent技術也被開發者們提上了2025學習日程。

OpenAI智能體新線索曝光!網友:新ChatGPT時刻要來了

好嘛,不管是企業還是個人,接下來大家都得卷Agent了(doge)。

Tags:
相關推薦
免責聲明
本文所包含的觀點僅代表作者個人看法,不代表新火種的觀點。在新火種上獲取的所有信息均不應被視為投資建議。新火種對本文可能提及或鏈接的任何項目不表示認可。 交易和投資涉及高風險,讀者在采取與本文內容相關的任何行動之前,請務必進行充分的盡職調查。最終的決策應該基于您自己的獨立判斷。新火種不對因依賴本文觀點而產生的任何金錢損失負任何責任。

熱門文章