首頁 > AI資訊 > 最新資訊 > 考試中擊敗90%的人類!GPT升級了:更可靠、更有創(chuàng)造力

考試中擊敗90%的人類!GPT升級了:更可靠、更有創(chuàng)造力

新火種    2023-09-11

每經(jīng)

憑借ChatGPT掀起人工智能(AI)應(yīng)用熱潮的OpenAI發(fā)布了最新作品——GPT-4。得到這種新模型支持的ChatGPT將迎來升級。

當(dāng)?shù)貢r間周二(3月14日),人工智能研究公司OpenAI公布了其大型語言模型的最新版本——GPT-4。該公司表示,GPT-4在許多專業(yè)測試中表現(xiàn)出超過絕大多數(shù)人類的水平。OpenAI還稱,GPT-4參加了多種基準(zhǔn)考試測試,包括美國律師資格考試Uniform Bar Exam、法學(xué)院入學(xué)考試LSAT、“美國高考”SAT數(shù)學(xué)部分和證據(jù)性閱讀與寫作部分的考試,在這些測試中,它的得分高于88%的應(yīng)試者。

OpenAI推出GPT-4

OpenAI周二表示,在內(nèi)部評估中,GPT-4產(chǎn)生正確回應(yīng)的可能性要比GPT-3.5高出40%。而且GPT-4是多模態(tài)的,同時支持文本和圖像輸入功能。OpenAI稱,GPT-4比以前的版本“更大”,這意味著其已經(jīng)在更多的數(shù)據(jù)上進(jìn)行了訓(xùn)練,并且在模型文件中有更多的權(quán)重,這使得它的運行成本更高。

據(jù)OpenAI介紹,在某些情況下,GPT-4比之前的GPT-3.5版本有了巨大改進(jìn),新模型將產(chǎn)生更少的錯誤答案,更少地偏離談話軌道,更少地談?wù)摻稍掝},甚至在許多標(biāo)準(zhǔn)化測試中比人類表現(xiàn)得更好。

例如,GPT-4在模擬律師資格考試的成績在考生中排名前10%左右,在SAT閱讀考試中排名前7%左右,在SAT數(shù)學(xué)考試中排名前11%左右。

OpenAI表示,已經(jīng)與多家公司合作,要將GPT-4結(jié)合到他們的產(chǎn)品中,包括Duolingo、Stripe和Khan Academy。GPT-4模型也將以API的形式,提供給付費版ChatGPT Plus的訂閱用戶。開發(fā)者可以注冊,用它打造應(yīng)用。微軟此后表示,新款的必應(yīng)(Bing)搜索引擎將運行于GPT-4系統(tǒng)之上。

OpenAI表示,雖然兩個版本在日常對話中看起來很相似,但當(dāng)任務(wù)復(fù)雜到一定程度時,差異就表現(xiàn)出來了,GPT-4更可靠、更有創(chuàng)造力,能夠處理更微妙的指令。“在我們的內(nèi)部評估中,它產(chǎn)生正確回應(yīng)的可能性比GPT-3.5高40%。”

在上述示例中,可以看到GPT-4系統(tǒng)如何應(yīng)答圖像輸入內(nèi)容,比如像上述截圖那樣解釋圖片的不同尋常之處、圖片的幽默之處、一個搞怪圖片的用意

不過,OpenAI也警告稱,GPT-4還不完美,在許多情況下,它的能力不如人類。該公司表示:“GPT-4仍有許多已知的局限性,我們正在努力解決,比如社會偏見、幻覺和對抗性提示。”

OpenAI透露,摩根士丹利正在使用GPT-4來組織數(shù)據(jù),而電子支付公司Stripe正在測試GPT-4是否有助于打擊欺詐。其他客戶還包括語言學(xué)習(xí)公司Duolingo、Khan Academy和冰島政府。

OpenAI合作伙伴微軟周二表示,新版必應(yīng)搜索引擎將使用GPT-4。

OpenAI聯(lián)合創(chuàng)始人:未來AI將首先替代基于認(rèn)知的工作

據(jù)每日經(jīng)濟新聞3月14日報道,當(dāng)?shù)貢r間3月10日至19日,西南偏南多元創(chuàng)新大會和藝術(shù)節(jié)(SXSW)在美國得克薩斯州奧斯汀舉行。如果說去年SXSW的主題是關(guān)于Web3、NFT和元宇宙,那么今年的SXSW顯然展現(xiàn)出完全不同的景象,ChatGPT幾乎成為貫穿每場活動的話題。

圖片來源:視覺中國

3月10日,OpenAI聯(lián)合創(chuàng)始人兼總裁Greg Brockman在當(dāng)天舉行的活動現(xiàn)場接受了外媒的專訪,在長達(dá)一小時的談話中,Brockman談到了許多與ChatGPT和人工智能(AI)的話題。當(dāng)天,現(xiàn)場座無虛席,觀眾時不時因為Greg的發(fā)言而發(fā)出陣陣呼聲。

與許多人一樣,在Brockman的暢想中,未來的通用AI將給人類帶來顛覆性的影響。他認(rèn)為,未來AI更像是一個全天候的助手,它能夠“放大”人們的能力,并幫助人類獲得新的想法。

“想想今天,每個人都在看同一個電視節(jié)目,也許人們都在看《權(quán)力的游戲》的最后一季,”他說,“但想象一下,如果你可以讓你的AI以不同的方式進(jìn)行,甚至可能將自己作為主角置身其中,并進(jìn)行互動體驗。”

在此之前,許多人——包括Brockman本人在內(nèi)——都認(rèn)為AI將從一些體力勞動開始替代人類的工作,但如今的事實恰好相反。Brockman在談話中表示,未來人類基于認(rèn)知的工作將首先被機器取代,例如內(nèi)容審核。因此,在AI浪潮中,人類需要更高級別的技能、判斷和認(rèn)知。

每日經(jīng)濟新聞綜合每經(jīng)網(wǎng)(記者:文巧)、OpenAI官網(wǎng)

每日經(jīng)濟新聞

相關(guān)推薦
免責(zé)聲明
本文所包含的觀點僅代表作者個人看法,不代表新火種的觀點。在新火種上獲取的所有信息均不應(yīng)被視為投資建議。新火種對本文可能提及或鏈接的任何項目不表示認(rèn)可。 交易和投資涉及高風(fēng)險,讀者在采取與本文內(nèi)容相關(guān)的任何行動之前,請務(wù)必進(jìn)行充分的盡職調(diào)查。最終的決策應(yīng)該基于您自己的獨立判斷。新火種不對因依賴本文觀點而產(chǎn)生的任何金錢損失負(fù)任何責(zé)任。

熱門文章