av最新网址,小鲜肉洗澡时自慰网站xnxx,黄色一级片大全

首頁 > AI資訊 > 最新資訊 > ChatGPT錯誤太多，正在制造傷害

ChatGPT錯誤太多，正在制造傷害

財(cái)富中文網(wǎng) 2023-11-23

微軟首席執(zhí)行官薩蒂亞·納德拉。該公司不得不限制其基于OpenAI的新版必應(yīng)聊天功能的對話次數(shù)，以防止聊天機(jī)器人偏離正軌，化身為一個自稱希德尼的令人不安的角色。圖片來源：SEONGJOON CHO—BLOOMBERG VIA GETTY IMAGES

芝加哥城市新聞署（City News Bureau of Chicago）是一家目前已經(jīng)倒閉的新聞機(jī)構(gòu)，曾經(jīng)被譽(yù)為培訓(xùn)意志堅(jiān)定的實(shí)地報(bào)道記者的傳奇基地，該機(jī)構(gòu)有一句著名的非官方格言：“如果你的母親說她愛你，那也得去核實(shí)一下。”多虧了ChatGPT、新版必應(yīng)搜索（Bing Search）、Bard和大量基于大型語言模型的山寨搜索聊天機(jī)器人的出現(xiàn)，我們不得不奉行該機(jī)構(gòu)的古老信條。

研究人員已經(jīng)知道，對于搜索查詢或任何基于事實(shí)的請求來說，大型語言模型訓(xùn)練出來的引擎都遠(yuǎn)非完美，因?yàn)檫@樣的引擎傾向于編造事物（人工智能研究人員稱之為“幻覺”現(xiàn)象）。但科技公司巨頭認(rèn)為，可以進(jìn)行對話的用戶界面帶來的“利”大于“弊”（提供的信息不準(zhǔn)確或是提供了錯誤信息），這些大型語言模型能夠執(zhí)行大量從翻譯到做總結(jié)的自然語言相關(guān)任務(wù)，還可以將這些模型與其他軟件工具結(jié)合起來執(zhí)行任務(wù)（無論是進(jìn)行搜索還是預(yù)訂劇院門票）。

當(dāng)然，當(dāng)這些系統(tǒng)產(chǎn)生幻覺時，可能會造成真正的損害——甚至當(dāng)它們沒有產(chǎn)生幻覺時，只是從訓(xùn)練數(shù)據(jù)中學(xué)習(xí)了一些與事實(shí)有出入的東西，也會造成真正的損害。Stack Overflow不得不禁止用戶提交使用ChatGPT生成的編碼，因?yàn)樵摼W(wǎng)站上充斥著看似合理但實(shí)則錯誤的代碼。科幻雜志《克拉克世界》（Clarkesworld）不得不停止接受投稿，因?yàn)楹芏嗳颂峤坏墓适虏⒉皇撬麄冏约簞?chuàng)作的，而是ChatGPT創(chuàng)作的。一家名為OpenCage的德國公司提供能夠進(jìn)行地理編碼的應(yīng)用程序接口，該接口可以將物理地址轉(zhuǎn)換為能夠標(biāo)記在地圖上的經(jīng)緯度坐標(biāo)。該公司表示，由于ChatGPT的推薦出錯（將其應(yīng)用程序接口作為一種僅根據(jù)號碼就可以查找手機(jī)位置的方法做了推薦），他們不得不應(yīng)對越來越多大失所望的注冊用戶。ChatGPT甚至還幫助用戶編寫了python代碼，允許他們?yōu)榇四康恼{(diào)用OpenCage的應(yīng)用程序接口。

但是，正如OpenCage被迫在一篇博文中解釋的那樣，這不是它提供的服務(wù)，也不是使用該公司的技術(shù)能夠?qū)崿F(xiàn)的。OpenCage表示，ChatGPT之所以有這樣錯誤的想法，是因?yàn)樗鼜腨ouTube的視頻教程中學(xué)習(xí)了相關(guān)內(nèi)容，有人聲稱OpenCage的應(yīng)用程序接口可以用于反向推斷手機(jī)地理定位，其實(shí)這種說法是錯誤的。但是，那些教程只說服了少數(shù)人注冊O(shè)penCage的應(yīng)用程序接口，而ChatGPT卻促使人們成群結(jié)隊(duì)地注冊O(shè)penCage。OpenCage寫道：“關(guān)鍵的區(qū)別在于，人們在接受他人的建議時持懷疑態(tài)度，例如在視頻編碼教程學(xué)習(xí)時，人們也會持懷疑態(tài)度。但在人工智能或ChatGPT方面，我們似乎還沒有把這一點(diǎn)內(nèi)化于心。我想我們最好把這一點(diǎn)內(nèi)化于心，保持適當(dāng)?shù)膽岩蓱B(tài)度。”

與此同時，在一系列關(guān)于其基于OpenAI的新版必應(yīng)聊天功能的陰暗面的報(bào)道引發(fā)人們擔(dān)憂后——聊天機(jī)器人自稱希德尼，變得很暴躁，有時甚至充滿敵意，極具威脅性——微軟（Microsoft）決定限制用戶與必應(yīng)聊天機(jī)器人的對話長度。但正如我和其他許多人所發(fā)現(xiàn)的那樣，顯而易見的是，雖然這種對對話長度的隨意限制讓新版必應(yīng)的聊天功能更安全，但也讓它的功能大打折扣。

比如，我向必應(yīng)聊天詢問了計(jì)劃去希臘旅行的問題。我正試圖讓它為建議的行程提供詳細(xì)的時間安排和航班選擇時，這時突然彈出“哎呀，我們的對話到此結(jié)束嘍。如果你還想繼續(xù)和我聊天的話，就請點(diǎn)擊‘新話題’！”

長度限制顯然是微軟被迫給出的“克魯格”（不夠精巧，但還能夠應(yīng)付要求的解決方案），因?yàn)樗婚_始就沒有對其新產(chǎn)品進(jìn)行足夠嚴(yán)格的測試。關(guān)于Prometheus（微軟對新版必應(yīng)模型的命名）究竟是什么，以及它究竟有什么功能，還有很多亟待解決的問題（沒有人聲稱新版必應(yīng)有感知能力或自我意識，但新版必應(yīng)出現(xiàn)了一些非常奇怪的突現(xiàn)行為，甚至超出了希德尼人格的范疇，微軟應(yīng)該就此事做出解釋，而不是假裝它不存在）。微軟在公開場合對它和OpenAI如何創(chuàng)建了這個模型諱莫如深。除了微軟之外，沒有人確切地知道為什么新版必應(yīng)聊天機(jī)器人傾向于扮演暴躁的希德尼的角色，而當(dāng)ChatGPT基于一個更小、功能更弱的大型語言模型時，它似乎表現(xiàn)得好得多——而且，微軟對它已知的事情也是三緘其口。

[OpenAI的早期研究發(fā)現(xiàn)，通常情況下，用更高質(zhì)量的數(shù)據(jù)訓(xùn)練出來的較小模型會給出人類用戶更喜歡的答案，盡管在一些基準(zhǔn)測試中，它們的表現(xiàn)不如大模型。這導(dǎo)致一些人猜測Prometheus是OpenAI的GPT-4，該模型被認(rèn)為比之前推出的任何模型都要大很多倍。但如果是這樣的話，微軟為什么選擇使用GPT-4，而不是一個更小但性能更好的系統(tǒng)來支持新版必應(yīng)，這是真正的問題所在。坦率地說，另外一個問題是，如果OpenAI實(shí)際上意識到新版必應(yīng)聊天機(jī)器人很有可能讓用戶感到不安，那么為什么它會建議微軟使用更強(qiáng)大的模型呢？微軟的研究人員可能和許多人工智能研究人員前輩一樣，被領(lǐng)先的基準(zhǔn)性能蒙蔽了雙眼（他們可以向其他人工智能開發(fā)人員炫耀這些性能），但這些性能本身卻是非常差的指標(biāo)，并不能代表人類用戶的需求。]

可以肯定的是，如果微軟不盡快解決這個問題，如果其他公司，例如谷歌（正在努力完善其即將推出的搜索聊天機(jī)器人），或者包括Perplexity和You.com等創(chuàng)業(yè)公司在內(nèi)的任何一家（已經(jīng)推出了自己的聊天機(jī)器人）表明他們的聊天機(jī)器人能夠進(jìn)行長時間對話，而且也不會變身達(dá)米安這樣的人格，那么微軟就有可能在新的搜索引擎之爭中失去其先發(fā)優(yōu)勢。

同時，讓我們花點(diǎn)時間來感受一下這樣的反諷，微軟，一家曾經(jīng)以自己是最負(fù)責(zé)任的大型科技公司而自豪的公司（不無道理），現(xiàn)在卻讓我們重回早期社交媒體時代“快速行動，打破陳例”的艱難往昔——可能后果更糟。（但我猜，當(dāng)你的首席執(zhí)行官癡迷于讓他的主要競爭對手“跳舞”時，樂隊(duì)里的樂手們很難反駁說，也許他們不應(yīng)該現(xiàn)在就開始演奏這首曲子。）除了OpenCage、《克拉克世界》和Stack Overflow之外，人們還可能因?yàn)殄e誤的用藥建議而導(dǎo)致嚴(yán)重后果，因?yàn)轭愃葡５履岬呐按袨閷?dǎo)致某人自殘或自殺，或者因?yàn)閺?qiáng)化可憎的刻板印象和措辭而受到傷害。

我以前說過這一點(diǎn)，但我要再強(qiáng)調(diào)一遍：鑒于這些潛在的威脅，現(xiàn)在是時候讓政府介入，就如何構(gòu)建和部署系統(tǒng)制定明確的規(guī)定。基于風(fēng)險的方法是起點(diǎn)，比如歐盟（European Union）的人工智能法案提案（A.I. Act）的最初草案中提出的想法。但風(fēng)險的定義和評估不應(yīng)該完全由公司自己來決定。如果沒有特定的標(biāo)準(zhǔn)，就需要有明確的外部標(biāo)準(zhǔn)和相應(yīng)的問責(zé)制度。（財(cái)富中文網(wǎng)）

譯者：中慧言-王芳

Tags:

錯誤

相關(guān)推薦

免責(zé)聲明: 本文所包含的觀點(diǎn)僅代表作者個人看法，不代表新火種的觀點(diǎn)。在新火種上獲取的所有信息均不應(yīng)被視為投資建議。新火種對本文可能提及或鏈接的任何項(xiàng)目不表示認(rèn)可。交易和投資涉及高風(fēng)險，讀者在采取與本文內(nèi)容相關(guān)的任何行動之前，請務(wù)必進(jìn)行充分的盡職調(diào)查。最終的決策應(yīng)該基于您自己的獨(dú)立判斷。新火種不對因依賴本文觀點(diǎn)而產(chǎn)生的任何金錢損失負(fù)任何責(zé)任。

ChatGPT錯誤太多，正在制造傷害

賈躍亭評蘋果放棄造車：“大錯誤”，庫克終究不是喬布斯

華能水電申請基于人工智能自查詢的集控平臺錯誤分析系統(tǒng)專利，提高錯誤檢測效率和準(zhǔn)確性

ChatGPT錯誤太多，正在制造傷害

圖與代碼不一致，Transformer論文被發(fā)現(xiàn)錯誤，網(wǎng)友：早該被指出1000次

量子計(jì)算錯誤識別能力提升十倍

熱門文章