首頁 > AI資訊 > 最新資訊 > ChatGPT錯誤太多,正在制造傷害

ChatGPT錯誤太多,正在制造傷害

財(cái)富中文網(wǎng)    2023-11-23

微軟首席執(zhí)行官薩蒂亞·納德拉。該公司不得不限制其基于OpenAI的新版必應(yīng)聊天功能的對話次數(shù),以防止聊天機(jī)器人偏離正軌,化身為一個自稱希德尼的令人不安的角色。圖片來源:SEONGJOON CHO—BLOOMBERG VIA GETTY IMAGES

芝加哥城市新聞署(City News Bureau of Chicago)是一家目前已經(jīng)倒閉的新聞機(jī)構(gòu),曾經(jīng)被譽(yù)為培訓(xùn)意志堅(jiān)定的實(shí)地報(bào)道記者的傳奇基地,該機(jī)構(gòu)有一句著名的非官方格言:“如果你的母親說她愛你,那也得去核實(shí)一下。”多虧了ChatGPT、新版必應(yīng)搜索(Bing Search)、Bard和大量基于大型語言模型的山寨搜索聊天機(jī)器人的出現(xiàn),我們不得不奉行該機(jī)構(gòu)的古老信條。

研究人員已經(jīng)知道,對于搜索查詢或任何基于事實(shí)的請求來說,大型語言模型訓(xùn)練出來的引擎都遠(yuǎn)非完美,因?yàn)檫@樣的引擎傾向于編造事物(人工智能研究人員稱之為“幻覺”現(xiàn)象)。但科技公司巨頭認(rèn)為,可以進(jìn)行對話的用戶界面帶來的“利”大于“弊”(提供的信息不準(zhǔn)確或是提供了錯誤信息),這些大型語言模型能夠執(zhí)行大量從翻譯到做總結(jié)的自然語言相關(guān)任務(wù),還可以將這些模型與其他軟件工具結(jié)合起來執(zhí)行任務(wù)(無論是進(jìn)行搜索還是預(yù)訂劇院門票)。

當(dāng)然,當(dāng)這些系統(tǒng)產(chǎn)生幻覺時,可能會造成真正的損害——甚至當(dāng)它們沒有產(chǎn)生幻覺時,只是從訓(xùn)練數(shù)據(jù)中學(xué)習(xí)了一些與事實(shí)有出入的東西,也會造成真正的損害。Stack Overflow不得不禁止用戶提交使用ChatGPT生成的編碼,因?yàn)樵摼W(wǎng)站上充斥著看似合理但實(shí)則錯誤的代碼。科幻雜志《克拉克世界》(Clarkesworld)不得不停止接受投稿,因?yàn)楹芏嗳颂峤坏墓适虏⒉皇撬麄冏约簞?chuàng)作的,而是ChatGPT創(chuàng)作的。一家名為OpenCage的德國公司提供能夠進(jìn)行地理編碼的應(yīng)用程序接口,該接口可以將物理地址轉(zhuǎn)換為能夠標(biāo)記在地圖上的經(jīng)緯度坐標(biāo)。該公司表示,由于ChatGPT的推薦出錯(將其應(yīng)用程序接口作為一種僅根據(jù)號碼就可以查找手機(jī)位置的方法做了推薦),他們不得不應(yīng)對越來越多大失所望的注冊用戶。ChatGPT甚至還幫助用戶編寫了python代碼,允許他們?yōu)榇四康恼{(diào)用OpenCage的應(yīng)用程序接口。

但是,正如OpenCage被迫在一篇博文中解釋的那樣,這不是它提供的服務(wù),也不是使用該公司的技術(shù)能夠?qū)崿F(xiàn)的。OpenCage表示,ChatGPT之所以有這樣錯誤的想法,是因?yàn)樗鼜腨ouTube的視頻教程中學(xué)習(xí)了相關(guān)內(nèi)容,有人聲稱OpenCage的應(yīng)用程序接口可以用于反向推斷手機(jī)地理定位,其實(shí)這種說法是錯誤的。但是,那些教程只說服了少數(shù)人注冊O(shè)penCage的應(yīng)用程序接口,而ChatGPT卻促使人們成群結(jié)隊(duì)地注冊O(shè)penCage。OpenCage寫道:“關(guān)鍵的區(qū)別在于,人們在接受他人的建議時持懷疑態(tài)度,例如在視頻編碼教程學(xué)習(xí)時,人們也會持懷疑態(tài)度。但在人工智能或ChatGPT方面,我們似乎還沒有把這一點(diǎn)內(nèi)化于心。我想我們最好把這一點(diǎn)內(nèi)化于心,保持適當(dāng)?shù)膽岩蓱B(tài)度。”

與此同時,在一系列關(guān)于其基于OpenAI的新版必應(yīng)聊天功能的陰暗面的報(bào)道引發(fā)人們擔(dān)憂后——聊天機(jī)器人自稱希德尼,變得很暴躁,有時甚至充滿敵意,極具威脅性——微軟(Microsoft)決定限制用戶與必應(yīng)聊天機(jī)器人的對話長度。但正如我和其他許多人所發(fā)現(xiàn)的那樣,顯而易見的是,雖然這種對對話長度的隨意限制讓新版必應(yīng)的聊天功能更安全,但也讓它的功能大打折扣。

比如,我向必應(yīng)聊天詢問了計(jì)劃去希臘旅行的問題。我正試圖讓它為建議的行程提供詳細(xì)的時間安排和航班選擇時,這時突然彈出“哎呀,我們的對話到此結(jié)束嘍。如果你還想繼續(xù)和我聊天的話,就請點(diǎn)擊‘新話題’!”

長度限制顯然是微軟被迫給出的“克魯格”(不夠精巧,但還能夠應(yīng)付要求的解決方案),因?yàn)樗婚_始就沒有對其新產(chǎn)品進(jìn)行足夠嚴(yán)格的測試。關(guān)于Prometheus(微軟對新版必應(yīng)模型的命名)究竟是什么,以及它究竟有什么功能,還有很多亟待解決的問題(沒有人聲稱新版必應(yīng)有感知能力或自我意識,但新版必應(yīng)出現(xiàn)了一些非常奇怪的突現(xiàn)行為,甚至超出了希德尼人格的范疇,微軟應(yīng)該就此事做出解釋,而不是假裝它不存在)。微軟在公開場合對它和OpenAI如何創(chuàng)建了這個模型諱莫如深。除了微軟之外,沒有人確切地知道為什么新版必應(yīng)聊天機(jī)器人傾向于扮演暴躁的希德尼的角色,而當(dāng)ChatGPT基于一個更小、功能更弱的大型語言模型時,它似乎表現(xiàn)得好得多——而且,微軟對它已知的事情也是三緘其口。

[OpenAI的早期研究發(fā)現(xiàn),通常情況下,用更高質(zhì)量的數(shù)據(jù)訓(xùn)練出來的較小模型會給出人類用戶更喜歡的答案,盡管在一些基準(zhǔn)測試中,它們的表現(xiàn)不如大模型。這導(dǎo)致一些人猜測Prometheus是OpenAI的GPT-4,該模型被認(rèn)為比之前推出的任何模型都要大很多倍。但如果是這樣的話,微軟為什么選擇使用GPT-4,而不是一個更小但性能更好的系統(tǒng)來支持新版必應(yīng),這是真正的問題所在。坦率地說,另外一個問題是,如果OpenAI實(shí)際上意識到新版必應(yīng)聊天機(jī)器人很有可能讓用戶感到不安,那么為什么它會建議微軟使用更強(qiáng)大的模型呢?微軟的研究人員可能和許多人工智能研究人員前輩一樣,被領(lǐng)先的基準(zhǔn)性能蒙蔽了雙眼(他們可以向其他人工智能開發(fā)人員炫耀這些性能),但這些性能本身卻是非常差的指標(biāo),并不能代表人類用戶的需求。]

可以肯定的是,如果微軟不盡快解決這個問題,如果其他公司,例如谷歌(正在努力完善其即將推出的搜索聊天機(jī)器人),或者包括Perplexity和You.com等創(chuàng)業(yè)公司在內(nèi)的任何一家(已經(jīng)推出了自己的聊天機(jī)器人)表明他們的聊天機(jī)器人能夠進(jìn)行長時間對話,而且也不會變身達(dá)米安這樣的人格,那么微軟就有可能在新的搜索引擎之爭中失去其先發(fā)優(yōu)勢。

同時,讓我們花點(diǎn)時間來感受一下這樣的反諷,微軟,一家曾經(jīng)以自己是最負(fù)責(zé)任的大型科技公司而自豪的公司(不無道理),現(xiàn)在卻讓我們重回早期社交媒體時代“快速行動,打破陳例”的艱難往昔——可能后果更糟。(但我猜,當(dāng)你的首席執(zhí)行官癡迷于讓他的主要競爭對手“跳舞”時,樂隊(duì)里的樂手們很難反駁說,也許他們不應(yīng)該現(xiàn)在就開始演奏這首曲子。)除了OpenCage、《克拉克世界》和Stack Overflow之外,人們還可能因?yàn)殄e誤的用藥建議而導(dǎo)致嚴(yán)重后果,因?yàn)轭愃葡5履岬呐按袨閷?dǎo)致某人自殘或自殺,或者因?yàn)閺?qiáng)化可憎的刻板印象和措辭而受到傷害。

我以前說過這一點(diǎn),但我要再強(qiáng)調(diào)一遍:鑒于這些潛在的威脅,現(xiàn)在是時候讓政府介入,就如何構(gòu)建和部署系統(tǒng)制定明確的規(guī)定。基于風(fēng)險的方法是起點(diǎn),比如歐盟(European Union)的人工智能法案提案(A.I. Act)的最初草案中提出的想法。但風(fēng)險的定義和評估不應(yīng)該完全由公司自己來決定。如果沒有特定的標(biāo)準(zhǔn),就需要有明確的外部標(biāo)準(zhǔn)和相應(yīng)的問責(zé)制度。(財(cái)富中文網(wǎng))

譯者:中慧言-王芳

Tags:
相關(guān)推薦
免責(zé)聲明
本文所包含的觀點(diǎn)僅代表作者個人看法,不代表新火種的觀點(diǎn)。在新火種上獲取的所有信息均不應(yīng)被視為投資建議。新火種對本文可能提及或鏈接的任何項(xiàng)目不表示認(rèn)可。 交易和投資涉及高風(fēng)險,讀者在采取與本文內(nèi)容相關(guān)的任何行動之前,請務(wù)必進(jìn)行充分的盡職調(diào)查。最終的決策應(yīng)該基于您自己的獨(dú)立判斷。新火種不對因依賴本文觀點(diǎn)而產(chǎn)生的任何金錢損失負(fù)任何責(zé)任。

熱門文章