首頁(yè) > AI資訊 > 最新資訊 > GPT新版本猜想:奧特曼草莓圖引發(fā)推理熱潮

GPT新版本猜想:奧特曼草莓圖引發(fā)推理熱潮

新火種    2024-09-07

昨晚深夜,OpenAI首席執(zhí)行官奧特曼(Sam Altman)在推特上發(fā)布了一張草莓的圖片,并配文“我喜歡花園里的夏天”。該條推特發(fā)布幾個(gè)小時(shí)就斬獲百萬(wàn)查看和近千條評(píng)論。

GPT新版本猜想:奧特曼草莓圖引發(fā)推理熱潮

人們除了在評(píng)論區(qū)分享奧特曼花園里的這張的草莓圖片,更多地討論的是草莓圖背后的隱藏故事。

GPT-5或?qū)l(fā)布?

不少評(píng)論認(rèn)為這張圖中暗示了下一代GPT-5的情況。

有網(wǎng)友推測(cè),圖中有五顆草莓,其中一顆還未成熟,或許代表著GPT-5還未準(zhǔn)備好推向市場(chǎng)。而草莓的成熟期一般為4到6周,這很可能暗示著GPT-5將在4到6周后進(jìn)行發(fā)布。

GPT新版本猜想:奧特曼草莓圖引發(fā)推理熱潮

也有網(wǎng)友認(rèn)為這也可能是在暗示GPT4.5即將落地。

GPT新版本猜想:奧特曼草莓圖引發(fā)推理熱潮

網(wǎng)友猜測(cè),五顆草莓有夾雜一顆未成熟的草莓代表的是GPT-4.5,而每一顆草莓都意味著在GPT-4.5發(fā)布前還要多等待一個(gè)月,也就是說GPT-4.5有可能在五個(gè)月后發(fā)布。

GPT新版本猜想:奧特曼草莓圖引發(fā)推理熱潮

也有網(wǎng)友持反對(duì)意見,認(rèn)為只有四顆成熟草莓應(yīng)該代表著今年夏天不會(huì)發(fā)布GPT-5。

GPT新版本猜想:奧特曼草莓圖引發(fā)推理熱潮

GPT-5或在推理方面有大升級(jí)

也有網(wǎng)友聯(lián)想到了此前OpenAI被爆出的新項(xiàng)目,Strawberry,前身是Q*算法模型。

就在奧特曼發(fā)布草莓圖前不久,網(wǎng)友發(fā)現(xiàn)LMsys的聊天機(jī)器人競(jìng)技場(chǎng)又有一個(gè)匿名新模型上榜,該模型自稱“基于GPT-4架構(gòu)”,網(wǎng)友猜測(cè)這就是Q*算法模型。

GPT新版本猜想:奧特曼草莓圖引發(fā)推理熱潮

他們認(rèn)為,未來發(fā)布的GPT-5或許內(nèi)置了Strawberry模型,將在今年夏天發(fā)布。

GPT新版本猜想:奧特曼草莓圖引發(fā)推理熱潮

GPT新版本猜想:奧特曼草莓圖引發(fā)推理熱潮

不過也有網(wǎng)友說這可能代表了Q*,也就是Strawberry模型,還在研發(fā)中沒有完全成熟。

GPT新版本猜想:奧特曼草莓圖引發(fā)推理熱潮

據(jù)傳,Strawberry涉及到了一種被稱為“后訓(xùn)練”(后訓(xùn)練階段涉及“微調(diào)”等方法,例如OpenAI一直倚重的RLHF方法就屬于此類。今天Andrej Karpathy 也發(fā)表了一條RLHF的熱點(diǎn)推文,AI科技評(píng)論將后續(xù)進(jìn)行整理,歡迎關(guān)注與討論)的特殊方法,能夠讓OpenAI的生成式AI模型經(jīng)過大量通用數(shù)據(jù)訓(xùn)練后,調(diào)整基礎(chǔ)模型以特定方式優(yōu)化其性能。

根據(jù)此前透露的文件,Strawberry模型的目標(biāo)是讓AI不僅能生成查詢答案,還能提前計(jì)劃,完全自主且可靠地瀏覽互聯(lián)網(wǎng),進(jìn)行OpenAI要求的深度研究。OpenAI希望Strawberry的創(chuàng)新能顯著提高其AI模型的推理能力,達(dá)到人類水準(zhǔn)甚至超越人類的推理水平。

還有網(wǎng)友做了其他推測(cè),認(rèn)為這可能直接指向了此前GPT-4o出現(xiàn)的草莓問題,即無(wú)法數(shù)清“strawberry”單詞中究竟包含了多少個(gè)字母“r”,未來推出的模型或許已經(jīng)解決了這個(gè)問題。

GPT新版本猜想:奧特曼草莓圖引發(fā)推理熱潮

而奧特曼本人則回復(fù)了這條歡迎來到level 2的推特,表示感覺非常不錯(cuò)。這也大大增強(qiáng)了GPT-5推理能力升級(jí)這一說法的可信度。

GPT新版本猜想:奧特曼草莓圖引發(fā)推理熱潮

這條推特的評(píng)論區(qū)有人貼出了此前OpenAI對(duì)未來AI的設(shè)想規(guī)劃,幫助解讀推特內(nèi)容。OpenAI把未來AI分成了兩個(gè)level,level 2代表著擁有人類水平的推理和問題解決能力。

GPT新版本猜想:奧特曼草莓圖引發(fā)推理熱潮

提升大模型的推理能力,使其能更自主地進(jìn)行任務(wù)分解、提案、評(píng)估和決策,并與其他智能體(Agents)合作解決問題,是包括OpenAI在內(nèi)的諸多公司希望實(shí)現(xiàn)通用人工智能(AGI)的突破的路徑之一。如今看來,OpenAI或許已經(jīng)找到了提升推理能力的一條新捷徑。

在今年5月奧特曼與MIT校長(zhǎng)Sally Kornbluth的一次對(duì)話中,他曾提及,GPT-5或?qū)?shù)據(jù)與推理引擎分離,把推理引擎作為獨(dú)立的東西來對(duì)待。如果這一設(shè)想得以實(shí)現(xiàn),或許大模型又將迎來類似從GPT-3到GPT4的重大飛躍。

奧特曼爭(zhēng)權(quán)勝券在握?

有網(wǎng)友認(rèn)為草莓圖暗示著未發(fā)布的Strawberry,并聯(lián)想到了此前與Strawberry的前身Q*有關(guān)的奧特曼被解雇一事。

GPT新版本猜想:奧特曼草莓圖引發(fā)推理熱潮

據(jù)知情人士透露,在奧特曼被董事會(huì)罷免之前,有幾名研究人員向董事會(huì)發(fā)出了一封信,信中警告道一項(xiàng)強(qiáng)大的人工智能可能會(huì)威脅到人類。而信中提及的強(qiáng)大的人工智能則在當(dāng)時(shí)被推測(cè)是Q*項(xiàng)目。

知情人士認(rèn)為,這封信是奧特曼被OpenAI解雇的重要原因之一。

此前負(fù)責(zé)OpenAI內(nèi)部AI安全對(duì)齊項(xiàng)目的Ilya Sutskever曾宣布成立一個(gè)超級(jí)對(duì)齊項(xiàng)目,關(guān)注AI的安全問題,把安全性和對(duì)AI能力的限制監(jiān)管等放在第一位。而奧特曼的觀念則有所不同,他更注重加速AI能力的提升,不斷加大各類測(cè)試和訓(xùn)練的強(qiáng)度。

觀念的沖突也最終導(dǎo)致了OpenAI團(tuán)隊(duì)的分崩離析。

去年Ilya Sutskever聯(lián)合其他幾位董事解雇了奧特曼,并解除了Greg Brockman的董事會(huì)職位。

在奧特曼于去年十一月回歸OpenAI后,Ilya Sutskever也在今年五月份宣布退出OpenAI團(tuán)隊(duì),成立了自己的初創(chuàng)公司。同樣負(fù)責(zé)超級(jí)對(duì)齊項(xiàng)目的Jan Leike也在同天離職。

另一位聯(lián)合創(chuàng)始人John Schulman則在前天宣布退出OpenAI,加入Anthropic專注研究AI對(duì)齊。據(jù)透露,OpenAI團(tuán)隊(duì)的安全負(fù)責(zé)人Aleksander Madry也被調(diào)崗負(fù)責(zé)其他項(xiàng)目。

此前與奧特曼在OpenAI發(fā)展理念上產(chǎn)生沖突的重要人員大多離職,在這場(chǎng)由Q*作為導(dǎo)火索引發(fā)的內(nèi)部斗爭(zhēng)中,似乎是奧特曼贏得了最后的勝利。而草莓圖也或許暗示著奧特曼在這次權(quán)力斗爭(zhēng)中勝券在握。

值得注意的是,相比起Yann Lecun、李飛飛、吳恩達(dá)等AI大牛旗幟鮮明地反對(duì)旨在為高風(fēng)險(xiǎn)的AI模型建立明確的安全標(biāo)準(zhǔn)的SB-1047法案,Sam Altman一直三緘其口,從未發(fā)表過對(duì)SB-1047法案的評(píng)論。或許奧特曼同樣信奉“Talk is cheap,show me the code”,但在即將實(shí)現(xiàn)重大突破的關(guān)口,也忍不住內(nèi)心的喜悅要發(fā)一張草莓圖來內(nèi)涵一下。

關(guān)于奧特曼分享的這張草莓圖,你有什么猜測(cè)呢?歡迎在評(píng)論區(qū)留下你的想法和大家討論。

GPT新版本猜想:奧特曼草莓圖引發(fā)推理熱潮

Tags:
相關(guān)推薦
免責(zé)聲明
本文所包含的觀點(diǎn)僅代表作者個(gè)人看法,不代表新火種的觀點(diǎn)。在新火種上獲取的所有信息均不應(yīng)被視為投資建議。新火種對(duì)本文可能提及或鏈接的任何項(xiàng)目不表示認(rèn)可。 交易和投資涉及高風(fēng)險(xiǎn),讀者在采取與本文內(nèi)容相關(guān)的任何行動(dòng)之前,請(qǐng)務(wù)必進(jìn)行充分的盡職調(diào)查。最終的決策應(yīng)該基于您自己的獨(dú)立判斷。新火種不對(duì)因依賴本文觀點(diǎn)而產(chǎn)生的任何金錢損失負(fù)任何責(zé)任。

熱門文章