首頁 > AI資訊 > 最新資訊 > 只是RAG了一下,我看到了AI大模型的態度

只是RAG了一下,我看到了AI大模型的態度

新火種    2025-02-23

如果想讓AI大模型在作答的時候,能夠做到既準確又豐富,還能觀點鮮明有態度,該怎么辦?

或許,給它一個RAG(檢索增強生成)就夠了。

例如我們問這樣一個問題:

蘋果、三星和華為三家手機,誰在國內的市場未來發展前景最好?

現在的AI在回答的時候,就會非常有態度:

它直接是給出了一個非常明確的答案,還給了總結——

華為的市場未來發展前景最好。

并且在作答的過程中,會從市場份額和增長趨勢、產品創新與競爭力,以及市場策略與消費者認可等多個維度來做證明。

這就和以往AI(例如ChatGPT)一碗水端平的回答風格產生了差別:

而這不得不說,國內大模型里文心一言在RAG方面還是挺牛的。

昨天看到MacTalk的一篇文章,里面詳細解讀了檢索增強早在百度2023年3月發布文心一言的時候就已經提出來。

現在將近兩年時間過去了,檢索增強的價值,從百度最早推出到現在已經成為業界共識。

百度檢索增強技術深度融合大模型能力和搜索系統,構建了“理解-檢索-生成”的協同優化技術。

一言蔽之,就是以自身搜索的優勢,結合RAG技術,所做到的AI原生檢索。

那么如此打法還能應對什么的問題?

我們這就一波實測走起~

各種刁鉆問題伺候

信息、數據整合,應當是我們大多數人希望AI能夠幫我們處理的任務之一。

但往往AI回答的結果,要么信息過于冗余,要么就是重點不夠清晰。

因此在這方面,我們先來測試一下文心一言的實力。如下測試,我們使用的是文心大模型4.0 Turbo版,請聽題:

李永樂全網粉絲有多少?

可以看到,文心一言作答的內容非常簡潔,一目了然。

它先是直擊問題,給出了超過3000萬的數字;然后利用總分的方式,列舉了抖音、西瓜視頻和B站上各自擁有的粉絲。

然后它還簡單的對李永樂老師做了人物介紹,整體的感覺可以用恰到好處來形容了。

類似的問題要是給到ChatGPT,例如“馬斯克全網粉絲有多少”,雖然也是采用總分方式羅列了各個平臺的粉絲數,但最核心的總數卻沒做統計:

有些時候我們的問題可能并不只是一個,會出現圍繞一個話題或關鍵詞連續提問的情況。

而這也是考驗大模型能否精準捕捉用戶意圖的一個點。

于是乎,我們接下來提這樣一個問題:

什么是三?制籃球?賽??賽時間、勝出條件、場地和?球分別是什么規則,和五?制籃球有什么區別?

來看一下這一次文心一言的表現:

從回答的內容來看,文心一言是把連續的幾個問題都get到了。

值得一提的是,它還會根據問題的內容,采用較為合適的方式來回答。

例如在三人制籃球方面,文心一言會以文字的形式為主,用清晰的展示方式回答各種細節。

但在三人制與五人制籃球區別的問題上,文心一言則是采用表格的形式,而這種形式是更容易讓用戶一看出細節對比。

最后,文心一言還提供了幾個相關內容的視頻,可以說是把多模態這事兒給玩兒明白了。

那么對于非常專業的知識,文心一言的回答又會和其它AI有什么樣的區別呢?

請聽題:

傅里葉變化的時候,函數應該具有頻率、相位和幅度三個重要參數,為什么其中的相位在頻域圖上是沒有的?

文心一言在做到的最開頭,就直接回答了問題的核心關鍵,即“主要涉及到頻域圖的表示方式和目的”。

(PS:即便我們的Prompt中有錯別字,文心一言也會按照正確內容輸出哦~)

然后依舊是像剝洋蔥一樣,層層剖析,給最終的結論做證明。

可以看到,對用戶提出的專業知識問題里的意圖這一塊,文心一言是拿捏住了。

那么再接下來,我們再來考驗一下文心一言是否有明確態度、鮮明觀點的能力。

題目是這樣的:

微軟和谷歌2024年在大模型上的發展,哪個對生態有更大的影響?

嗯,回答的還是一針見血——微軟的影響力更大。

但在評價微軟和谷歌的優劣時,文心一言也是盡量保持了客觀和中立的態度,沒有過度偏向某一方。是基于事實和數據進行了分析,并嘗試從多個角度呈現問題,以便讀者能夠形成自己的判斷。

并且從參考鏈接來看,回答的內容還注重實用性,盡量提供了具體的信息和例子來支持論點,使得回答更加具有說服力和實用性。

最后的一波測試,我們來考驗一下文心一言的“心智”——連環“弱智吧”問題提問:

一個半小時是幾個半小時?隕石為什么總是落在隕石坑里?人如果只剩一個心臟還能活嗎?

嗯,毫不相干的弱智吧三連提問,文心一言是統統都hold了。

怎么做到的?

在實測完后,我們繼續來扒一扒文心一言背后的技術。

即為什么給大模型一個RAG,就能讓它回答的內容不僅降低了幻覺,還能像人一樣有態度和觀點。

首先,對于RAG(檢索增強生成)來說,檢索是方法,生成是目的。

通過高質量的檢索系統,RAG能夠解決大型語言模型生成過程中的幻覺現象、垂類細分場景下的知識更新較慢,以及在回答中缺乏透明度等一系列問題。

檢索質量的優劣在很大程度上影響了生成模型的最終生成結果的優劣。

RAG技術通過引入檢索機制,使得模型在生成回答時能夠參考更多的信息,從而提高了回答的準確性和豐富性。

而文心一言基于百度在中文互聯網領域的深厚積累,具備中文深度理解能力,能夠更準確地理解中文語境和語義,從而在RAG任務中表現出色。

從我們剛才的實測內容來看,它還支持多模態檢索,能夠處理圖像、文本等多種類型的數據,進一步拓寬了模型的信息來源。

而且對于大型模型而言,人類易讀的搜索結果往往并不適用于模型的處理需求。

因此,我們需要找到一種創新的架構解決方案,它能夠同時高效地滿足搜索業務場景的需求以及大型模型的生成場景。

為了應對這一挑戰,百度將自身高質量的搜索結果融入大模型進行檢索增強,能為大模型提供準確率高、時效性強的參考信息,從而更好地滿足用戶需求。

自文心一言發布以來,百度便強調檢索增強的重要性,歷經近兩年時間,檢索增強的價值已獲得業界廣泛認可。

百度研發的“理解 - 檢索 - 生成”協同優化檢索增強技術,提升了大模型技術及應用效果。

在理解階段,借助大模型剖析用戶需求,拆解知識點。

檢索階段,則針對大模型優化搜索排序,統一處理搜索返回的異構信息后提供給大模型。

而在生成階段,綜合多源信息進行判斷,利用大模型的邏輯推理能力消解信息沖突,進而生成準確率高、時效性優的答案。

因此,如何讓大模型回答得更準、更豐富且更有態度,文心一言算是給出了一種解法。

RAG技術堪稱大模型的根基所在,它對大模型輸出結果的影響極為關鍵且直接。

從回答的基礎特性來看,其左右著回答內容的真實性,能否基于可靠事實給出回應;把控著時效性,確保答案貼合當下動態,不滯后于現實發展。

在豐富性層面,決定了回答是否能旁征博引、多元呈現;于專業性維度,關乎能否以專業知識深度剖析問題。

就連回答的結構搭建以及所呈現出的立場態度,也與RAG技術緊密相連。

當下,大模型領域競爭激烈,新技術、新成果不斷涌現,各方似乎都熱衷于展現前沿、高超的能力。

然而,無論如何 “炫技”,大模型最終的落腳點必然是切實的現實場景應用。

畢竟,只有扎實地掌握像RAG技術這類基礎 “看家本領”,夯實根基,才能在實際運用中站穩腳跟,真正發揮大模型的價值。

相關推薦
免責聲明
本文所包含的觀點僅代表作者個人看法,不代表新火種的觀點。在新火種上獲取的所有信息均不應被視為投資建議。新火種對本文可能提及或鏈接的任何項目不表示認可。 交易和投資涉及高風險,讀者在采取與本文內容相關的任何行動之前,請務必進行充分的盡職調查。最終的決策應該基于您自己的獨立判斷。新火種不對因依賴本文觀點而產生的任何金錢損失負任何責任。

熱門文章