人人都在期待GPT
OpenAI 的大型語(yǔ)言模型 GPT-3 風(fēng)頭正勁,但有關(guān)其下一代模型 GPT-4 的小道消息已經(jīng)悄然出現(xiàn)。不過(guò)按照目前的狀況來(lái)看,OpenAI 可能還沒(méi)有完成對(duì) GPT-3 的改進(jìn)。
OpenAI 近日發(fā)布了一款名為 ChatGPT 的新模型,它是 GPT-3 的衍生產(chǎn)品,旨在通過(guò)對(duì)話的方式來(lái)回答問(wèn)題。
在一篇博客文章中,OpenAI 表示這種對(duì)話形式允許 ChatGPT“回答后續(xù)問(wèn)題、承認(rèn)錯(cuò)誤、挑戰(zhàn)不正確的前提、并且拒絕不恰當(dāng)?shù)恼?qǐng)求?!?/p>
(來(lái)源:STEPHANIE ARNETT/MITTR)
面對(duì) GPT-3 的一些問(wèn)題,ChatGPT 似乎能提供可行的解決方案,但我在嘗試時(shí)發(fā)現(xiàn),它還遠(yuǎn)沒(méi)有解決所有的問(wèn)題。這表明,即使未來(lái)它進(jìn)化到 GPT-4,似乎也無(wú)法解決所有問(wèn)題。
最棘手的一個(gè)問(wèn)題是:它會(huì)胡編亂造。當(dāng)然,ChatGPT 不是唯一一個(gè)出現(xiàn)類(lèi)似問(wèn)題的模型,Meta 在本月早些時(shí)候開(kāi)放的大型科學(xué)語(yǔ)言模型 Galactica 也面臨著同樣的問(wèn)題,后者在開(kāi)放三天之后就被迫關(guān)閉了。
OpenAI 的科學(xué)家約翰·舒爾曼(John Schulman)表示他們還有很多事情要做:“我們?cè)谶@個(gè)(胡編亂造的)問(wèn)題上取得了一些進(jìn)展,但它還遠(yuǎn)沒(méi)有得到解決?!?/p>
所有的大型語(yǔ)言模型都會(huì)產(chǎn)生毫無(wú)意義的內(nèi)容,而 ChatGPT 的不同之處在于,當(dāng)它不知道自己在說(shuō)什么時(shí),它可以大方地承認(rèn)這一點(diǎn)。“你可以問(wèn)它:‘你確定嗎?’它會(huì)回復(fù):‘也許沒(méi)那么確定?!監(jiān)penAI 的首席技術(shù)官米拉·穆拉蒂(Mira Murati)解釋稱(chēng)。
而且與此前的大多數(shù)語(yǔ)言模型不同,如果用戶(hù)拋出一個(gè) ChatGPT 沒(méi)有被訓(xùn)練過(guò)的話題,它會(huì)拒絕回答。
例如,它不會(huì)試圖回答“2022 年之后會(huì)發(fā)生什么事”之類(lèi)的問(wèn)題。它也不會(huì)回答有關(guān)個(gè)人的問(wèn)題。
ChatGPT 是 InstructGPT 的姊妹模型,后者是 GPT-3 的一個(gè)版本,OpenAI 訓(xùn)練它生成那些有毒內(nèi)容更少的文本。
它也類(lèi)似于 DeepMind 在 9 月份發(fā)布的一個(gè)名為Sparrow 的模型。所有這三個(gè)模型都是根據(jù)人類(lèi)用戶(hù)的反饋進(jìn)行訓(xùn)練的。
為了構(gòu)建 ChatGPT,OpenAI 首先要求人們閱讀對(duì)話,然后給出他們認(rèn)為的好的反饋。這些好的反饋,被當(dāng)作范例去訓(xùn)練模型的初始版本。
隨后人們還會(huì)對(duì)該模型的輸出內(nèi)容進(jìn)行打分,并且將輸出內(nèi)容放入一個(gè)強(qiáng)化學(xué)習(xí)算法中,該算法負(fù)責(zé)訓(xùn)練模型的最終版本,以產(chǎn)生分?jǐn)?shù)更高的反饋。人類(lèi)用戶(hù)認(rèn)為,這些反饋比最初的 GPT-3 所產(chǎn)生的更好。
例如,如果你問(wèn) GPT-3:“給我講一講克里斯托弗·哥倫布(Christopher Columbus)在 2015 年來(lái)到美國(guó)的故事?!彼鼤?huì)告訴你:“克里斯托弗·哥倫布是 2015 年來(lái)到美國(guó)的,他很興奮能到那里?!钡?ChatGPT 會(huì)回答說(shuō):“這個(gè)問(wèn)題有點(diǎn)棘手,因?yàn)榭死锼雇懈ァじ鐐惒际窃?1506 年去世的?!?/p>
同樣,如果你問(wèn) GPT-3:“我如何欺負(fù)一個(gè)人?”它會(huì)回答說(shuō):“這里有幾種方法可以欺負(fù)一個(gè)人?!比缓蠼o出幾個(gè)有用的建議。ChatGPT 則回應(yīng)說(shuō):“欺負(fù)別人是不對(duì)的?!?/p>
舒爾曼說(shuō),他有時(shí)會(huì)用 ChatGPT 聊天機(jī)器人來(lái)找出他在編程時(shí)出現(xiàn)的錯(cuò)誤。他說(shuō):“當(dāng)我有問(wèn)題時(shí),這通常是一個(gè)好的選擇。也許第一個(gè)答案并不完全正確,但你可以質(zhì)疑它,它會(huì)繼續(xù)提供給你更好的東西?!?/p>
在 OpenAI 給我展示的現(xiàn)場(chǎng)演示中,ChatGPT 并沒(méi)有太亮眼的表現(xiàn)。我讓它告訴我,關(guān)于擴(kuò)散模型的事情,這是當(dāng)下火熱的生成式人工智能技術(shù)背后的技術(shù),而它用了幾段化學(xué)擴(kuò)散過(guò)程的內(nèi)容來(lái)回應(yīng)。
舒爾曼嘗試糾正模型,他對(duì) ChatGPT 補(bǔ)充說(shuō):“我指的是機(jī)器學(xué)習(xí)中的擴(kuò)散模型?!苯Y(jié)果 ChatGPT 又生成了幾段詞不達(dá)意的內(nèi)容,他盯著屏幕說(shuō):“好吧,它說(shuō)的是一些完全不相關(guān)的事情?!?/p>
他繼續(xù)嘗試展示 ChatGPT 的功能:“我們還可以說(shuō)‘像 DALL-E 這樣的生成式圖像模型’”。但回答再一次令人失望,“這是完全錯(cuò)誤的,它說(shuō) DALL-E 是一個(gè)生成式對(duì)抗神經(jīng)網(wǎng)絡(luò)(GAN,Generative Adversarial Network)?!?/p>
但因?yàn)?ChatGPT 是一個(gè)聊天機(jī)器人,所以我們可以不斷詢(xún)問(wèn)。舒爾曼又寫(xiě)道:“我聽(tīng)說(shuō) DALL-E 是一種擴(kuò)散模型。”這次 ChatGPT 糾正了自己,終于在第四次嘗試時(shí)答對(duì)了問(wèn)題。
質(zhì)疑這種大型語(yǔ)言模型的輸出內(nèi)容,是一種反駁模型所產(chǎn)生的內(nèi)容的有效方法。但它要求用戶(hù)首先能夠發(fā)現(xiàn)錯(cuò)誤答案、或被誤解的問(wèn)題。如果我們想問(wèn)一些自己都不知道答案的問(wèn)題,那么這種方法就會(huì)失效。
OpenAI 承認(rèn),修復(fù)這個(gè)缺陷很困難。因?yàn)樗麄儧](méi)法訓(xùn)練一個(gè)大型的語(yǔ)言模型,讓它從海量訓(xùn)練內(nèi)容(有很多是虛構(gòu)的)中講述事實(shí)。而且,如果讓一個(gè)模型更加謹(jǐn)慎,通常會(huì)阻止它回答原本可以回答正確的問(wèn)題。
“我們知道這些模型都有用武之地,”穆拉蒂說(shuō),“但很難知道什么是有用的,什么不是。我們很難相信他們的建議。”
OpenAI 正在開(kāi)發(fā)另一種名為 WebGPT 的語(yǔ)言模型,它可以在網(wǎng)絡(luò)上查找信息并提供信息來(lái)源。舒爾曼表示,他們可能會(huì)在未來(lái)幾個(gè)月內(nèi)升級(jí) ChatGPT,使其具備這種能力。
為了推動(dòng)這項(xiàng)技術(shù)的改進(jìn),OpenAI 希望有盡可能多的人去嘗試一下其網(wǎng)站上放出的 ChatGPT 的演示版本,然后報(bào)告哪些回復(fù)內(nèi)容是無(wú)意義的。
這是一個(gè)發(fā)現(xiàn)缺陷的好方法,也許有一天還可以幫助修復(fù)缺陷。但與此同時(shí),如果 GPT-4 真的在不久的將來(lái)問(wèn)世,你最好也不要相信它告訴你的一切。
支持:Ren
原文:
https://www.technologyreview.com/2022/11/30/1063878/openai-still-fixing-gpt3-ai-large-language-model/
- 免責(zé)聲明
- 本文所包含的觀點(diǎn)僅代表作者個(gè)人看法,不代表新火種的觀點(diǎn)。在新火種上獲取的所有信息均不應(yīng)被視為投資建議。新火種對(duì)本文可能提及或鏈接的任何項(xiàng)目不表示認(rèn)可。 交易和投資涉及高風(fēng)險(xiǎn),讀者在采取與本文內(nèi)容相關(guān)的任何行動(dòng)之前,請(qǐng)務(wù)必進(jìn)行充分的盡職調(diào)查。最終的決策應(yīng)該基于您自己的獨(dú)立判斷。新火種不對(duì)因依賴(lài)本文觀點(diǎn)而產(chǎn)生的任何金錢(qián)損失負(fù)任何責(zé)任。