首頁(yè) > AI資訊 > 最新資訊 > AI幻覺:它真的會(huì)一本正經(jīng)胡說(shuō)八道!

AI幻覺:它真的會(huì)一本正經(jīng)胡說(shuō)八道!

新火種    2025-02-20

你是不是也遇到過(guò)這樣的情況:?jiǎn)朅I一個(gè)問(wèn)題,它給了你一個(gè)特別詳細(xì)、豐富,看上去好有邏輯的答案。

但當(dāng)我們?nèi)ズ藢?shí)時(shí),卻發(fā)現(xiàn)這些信息完全是虛構(gòu)的?

這就是著名的“AI幻覺”現(xiàn)象。

AI幻覺:它真的會(huì)一本正經(jīng)胡說(shuō)八道!上下滑動(dòng)查看更多,圖源:河森堡新浪微博

為什么會(huì)出現(xiàn)AI幻覺呢?今天就讓我們一起來(lái)揭開這個(gè)謎題。

為什么會(huì)出現(xiàn)AI幻覺?

AI幻覺指的是AI會(huì)生成看似合理但實(shí)際確實(shí)錯(cuò)誤的信息,最常見的表現(xiàn)就是會(huì)編造一些不存在的事實(shí)或者細(xì)節(jié)。

就像在考試時(shí)遇到不會(huì)的題目,我們會(huì)試圖用已知的知識(shí)去推測(cè)答案一樣。

AI在遇到信息缺失或不確定的情況時(shí),會(huì)基于自己的“經(jīng)驗(yàn)”(訓(xùn)練數(shù)據(jù))進(jìn)行填補(bǔ)和推理。

這不是因?yàn)樗胍垓_我們,而是因?yàn)樗谠噲D用自己理解的模式來(lái)完成這個(gè)任務(wù)。

1、基于統(tǒng)計(jì)關(guān)系的預(yù)測(cè)

因?yàn)锳I(尤其是像ChatGPT這樣的語(yǔ)言模型)通過(guò)大量的訓(xùn)練數(shù)據(jù)學(xué)習(xí)文字之間的統(tǒng)計(jì)關(guān)系。它的核心目標(biāo)是根據(jù)上下文預(yù)測(cè)最可能出現(xiàn)的下一個(gè)詞,并不是對(duì)問(wèn)題或內(nèi)容進(jìn)行真正的理解。

所以,AI本質(zhì)上是通過(guò)概率最大化來(lái)生成內(nèi)容,而不是通過(guò)邏輯推理來(lái)生成內(nèi)容的。

簡(jiǎn)單來(lái)說(shuō),AI就像是一個(gè)博覽群書的智者,通過(guò)學(xué)習(xí)海量的文本和資料來(lái)獲取知識(shí)。但是它并不是真正理解這些知識(shí),而是通過(guò)找到文字之間的統(tǒng)計(jì)關(guān)系和模式來(lái)“預(yù)測(cè)”下一個(gè)最合適的詞。

換言之,AI是根據(jù)之前學(xué)到的大量例子,來(lái)猜測(cè)接下來(lái)最有可能出現(xiàn)的詞。

不過(guò)有時(shí)候,模型也會(huì)“猜錯(cuò)”。如果前面出現(xiàn)一點(diǎn)偏差,后面的內(nèi)容就會(huì)像滾雪球一樣越滾越大。

這就是為什么AI有時(shí)會(huì)從一個(gè)小錯(cuò)誤開始,最后編織出一個(gè)完全虛構(gòu)的故事。

2、訓(xùn)練數(shù)據(jù)的局限性

由于AI并沒有真實(shí)世界的體驗(yàn),它的所有“認(rèn)知”都來(lái)自訓(xùn)練數(shù)據(jù)。

可是訓(xùn)練數(shù)據(jù)不可能包含世界上所有的信息,有時(shí)候甚至還會(huì)包含錯(cuò)誤信息。這就像是一個(gè)人只能根據(jù)自己讀過(guò)的書來(lái)回答問(wèn)題。

如果書里有錯(cuò)誤信息,或者某些領(lǐng)域的知識(shí)缺失,就容易產(chǎn)生錯(cuò)誤的判斷。

舉個(gè)例子:早期AI幻覺較大的時(shí)候,可能會(huì)出現(xiàn)AI學(xué)過(guò)“北京是中國(guó)的首都”和“巴黎有埃菲爾鐵塔”這兩個(gè)知識(shí)點(diǎn)。

當(dāng)我們問(wèn)它“北京有什么著名建筑”時(shí),它可能會(huì)把這些知識(shí)錯(cuò)誤地混合在一起,說(shuō)“北京有埃菲爾鐵塔”。

3、過(guò)擬合問(wèn)題

因?yàn)榇竽P偷挠?xùn)練參數(shù)量非常龐大,大模型會(huì)在訓(xùn)練數(shù)據(jù)上產(chǎn)生“過(guò)擬合”的問(wèn)題。

也就是因?yàn)橛涀×颂噱e(cuò)誤或者無(wú)關(guān)緊要的東西,從而讓AI對(duì)訓(xùn)練數(shù)據(jù)中的噪聲過(guò)于敏感,最終導(dǎo)致幻覺產(chǎn)生。

4、有限的上下文窗口

受限于技術(shù)原因,雖然現(xiàn)在大模型的上下文窗口越來(lái)越大(比如可以處理64k或128k個(gè)tokens),但它們?nèi)匀皇窃谝粋€(gè)有限的范圍內(nèi)理解文本。

這就像是隔著一個(gè)小窗口看書,看不到整本書的內(nèi)容,容易產(chǎn)生理解偏差。

5、生成流暢回答的設(shè)計(jì)

現(xiàn)在很多大模型被設(shè)計(jì)成要給出流暢的回答,當(dāng)它對(duì)某個(gè)問(wèn)題不太確定時(shí),與其說(shuō)“我不知道”,它更傾向于基于已有知識(shí)編造看起來(lái)合理的答案。

上面的種種情況疊加在一起,造成了現(xiàn)在非常嚴(yán)重的AI幻覺問(wèn)題。

如何才能降低AI幻覺?

AI看起來(lái)很方便,但AI一本正經(jīng)的“胡說(shuō)八道”有時(shí)候真的讓人非常頭疼,給的信息經(jīng)常需要反復(fù)核實(shí),有時(shí)反而不如直接上網(wǎng)搜索來(lái)得實(shí)在。

那么,如何應(yīng)對(duì)AI幻覺呢?我們總結(jié)了下面這些方法幫助大家。

1、優(yōu)化提問(wèn)

想要獲得準(zhǔn)確答案,提問(wèn)方式很關(guān)鍵。與AI交流也需要明確和具體,避免模糊或開放性的問(wèn)題,提問(wèn)越具體、清晰,AI的回答越準(zhǔn)確。

同時(shí),我們?cè)谔釂?wèn)的時(shí)候要提供足夠多的上下文或背景信息,這樣也可以減少AI胡亂推測(cè)的可能性。總結(jié)成提示詞技巧就是下面四種問(wèn)法:

1.設(shè)定邊界:“請(qǐng)嚴(yán)格限定在2022年《自然》期刊發(fā)表的研究范圍內(nèi)”;

示例:“介紹ChatGPT的發(fā)展歷程”→“請(qǐng)僅基于OpenAI官方2022-2023年的公開文檔,介紹ChatGPT的發(fā)展歷程”

2.標(biāo)注不確定:“對(duì)于模糊信息,需要標(biāo)注‘此處為推測(cè)內(nèi)容’”;

示例:“分析特斯拉2025年的市場(chǎng)份額”→“分析特斯拉2025年的市場(chǎng)份額,對(duì)于非官方數(shù)據(jù)或預(yù)測(cè)性內(nèi)容,請(qǐng)標(biāo)注[推測(cè)內(nèi)容]”

3.步驟拆解:“第一步列舉確定的事實(shí)依據(jù),第二步展開詳細(xì)分析”;

示例:“評(píng)估人工智能對(duì)就業(yè)的影響”→“請(qǐng)分兩步評(píng)估AI對(duì)就業(yè)的影響:

1)先列出目前已發(fā)生的具體影響案例;

2)基于這些案例進(jìn)行未來(lái)趨勢(shì)分析”。

4.明確約束:明確告訴AI要基于已有事實(shí)回答,不要進(jìn)行推測(cè)。

示例:“預(yù)測(cè)2024年房地產(chǎn)市場(chǎng)走勢(shì)”→“請(qǐng)僅基于2023年的實(shí)際房地產(chǎn)數(shù)據(jù)和已出臺(tái)的相關(guān)政策進(jìn)行分析,不要加入任何推測(cè)性內(nèi)容”。

2、分批輸出

因?yàn)锳I內(nèi)容是根據(jù)概率來(lái)進(jìn)行生成的,一次性生成的內(nèi)容越多,出現(xiàn)AI幻覺的概率就越大,我們可以主動(dòng)限制它的輸出數(shù)量。

比如:如果我要寫一篇長(zhǎng)文章,就會(huì)這么跟AI說(shuō):“咱們一段一段來(lái)寫,先把開頭寫好。等這部分滿意了,再繼續(xù)寫下一段。”

這樣不僅內(nèi)容更準(zhǔn)確,也更容易把控生成內(nèi)容的質(zhì)量。

3、交叉驗(yàn)證

想要提高AI回答的可靠性,還有一個(gè)實(shí)用的方法是采用“多模型交叉驗(yàn)證”。

使用的一個(gè)AI聚合平臺(tái):可以讓多個(gè)AI模型同時(shí)回答同一個(gè)問(wèn)題。

當(dāng)遇到需要嚴(yán)謹(jǐn)答案的問(wèn)題時(shí),就會(huì)啟動(dòng)這個(gè)功能,讓不同的大模型一起參與討論,通過(guò)對(duì)比它們的答案來(lái)獲得更全面的認(rèn)識(shí)。

AI幻覺:它真的會(huì)一本正經(jīng)胡說(shuō)八道!點(diǎn)擊可放大,圖片來(lái)源:作者提供

再比如納米AI搜索平臺(tái)的“多模型協(xié)作”功能,它能讓不同的AI模型各司其職,形成一個(gè)高效的協(xié)作團(tuán)隊(duì)。

讓擅長(zhǎng)推理的DeepSeek-R1負(fù)責(zé)分析規(guī)劃,再由通義千問(wèn)進(jìn)行糾錯(cuò)補(bǔ)充,最后交給豆包AI來(lái)梳理總結(jié)。

這種“專家組”式的協(xié)作模式,不僅能提升內(nèi)容的可信度,還能帶來(lái)更加全面和深入的見解。

AI幻覺:它真的會(huì)一本正經(jīng)胡說(shuō)八道!上下滑動(dòng)查看更多,圖源:作者提供

4、RAG技術(shù)

AI是一個(gè)聰明但健忘的人,為了讓他表現(xiàn)更靠譜,我們可以給他配一個(gè)超級(jí)百科全書,他可以隨時(shí)查閱里面的內(nèi)容來(lái)回答問(wèn)題。

這本“百科全書”就是RAG的核心,它讓AI在回答問(wèn)題之前,先從可靠的資料中找到相關(guān)信息,再根據(jù)這些信息生成答案。

這樣一來(lái),AI就不容易“胡說(shuō)八道”了。

目前RAG技術(shù)多用在醫(yī)療、法律、金融等專業(yè)領(lǐng)域,通過(guò)構(gòu)建知識(shí)庫(kù)來(lái)提升回答的準(zhǔn)確性。

當(dāng)然實(shí)際使用中像醫(yī)療、法律、金融這樣的高風(fēng)險(xiǎn)領(lǐng)域,AI生成的內(nèi)容還是必須要經(jīng)過(guò)專業(yè)人士的審查的。

5、巧用AI幻覺

最后再說(shuō)一個(gè)AI幻覺的好處。很多時(shí)候AI幻覺也是天馬行空的創(chuàng)意火花!

就像一個(gè)異想天開的藝術(shù)家,不受常規(guī)思維的束縛,能蹦出令人驚喜的點(diǎn)子。

看看DeepSeek就知道了,它確實(shí)比ChatGPT和Claude更容易出現(xiàn)幻覺,但是今年DeepSeek能火得如此出圈也離不開其強(qiáng)大的創(chuàng)造能力。

有時(shí)候與其把AI幻覺當(dāng)成缺陷,不如把它看作創(chuàng)意的源泉!在寫作、藝術(shù)創(chuàng)作或頭腦風(fēng)暴時(shí),這些“跳躍性思維”反而可能幫我們打開新世界的大門。

AI幻覺的本質(zhì)——AI在知識(shí)的迷霧中,有時(shí)會(huì)創(chuàng)造出看似真實(shí),實(shí)則虛幻的“影子”。

但就像任何工具一樣,關(guān)鍵在于如何使用。當(dāng)我們學(xué)會(huì)用正確的方式與AI對(duì)話,善用它的創(chuàng)造力,同時(shí)保持獨(dú)立思考,AI就能成為我們得力的助手,而不是一個(gè)“能言善辯的謊言家”。

畢竟,在這個(gè)AI與人類共同進(jìn)步的時(shí)代,重要的不是責(zé)備AI的不完美,而是學(xué)會(huì)與之更好地協(xié)作。


相關(guān)推薦
免責(zé)聲明
本文所包含的觀點(diǎn)僅代表作者個(gè)人看法,不代表新火種的觀點(diǎn)。在新火種上獲取的所有信息均不應(yīng)被視為投資建議。新火種對(duì)本文可能提及或鏈接的任何項(xiàng)目不表示認(rèn)可。 交易和投資涉及高風(fēng)險(xiǎn),讀者在采取與本文內(nèi)容相關(guān)的任何行動(dòng)之前,請(qǐng)務(wù)必進(jìn)行充分的盡職調(diào)查。最終的決策應(yīng)該基于您自己的獨(dú)立判斷。新火種不對(duì)因依賴本文觀點(diǎn)而產(chǎn)生的任何金錢損失負(fù)任何責(zé)任。

熱門文章