肖仰華:大模型不能停留在“煉金術”而要成為科學
《科創板日報》11月8日訊(記者 朱凌)“大模型唯有走向千行百業,與實體經濟深度融合,才能創造價值。也只有真正創造價值,大模型才能真正地可持續發展。”11月7日,在財聯社“上海之巔 論道AI”大模型閉門會上,復旦大學教授、上海市數據科學重點實驗室主任肖仰華發表演講時如是說。
▍通用大模型為何能“出道”?
在大模型“出道”前,肖仰華長期從事知識圖譜研究。他在演講中直言,“知識圖譜最怕開放性問題,它只能解決已設定知識內的問題,凡超出范圍和邊界就無法應對。”
與只能勝任封閉任務的傳統小模型或知識工程相比,通用大模型到底提供了什么新能力?
肖仰華認為,大模型具備開放世界的理解能力。與傳統模型相比,通用大模型在開放理解、舉一反三、跨學科認知等方面的能力格外突出。
針對通用大模型的開放理解能力,肖仰華舉了一個非常形象的例子:一個病人在向問答模型詢問如何使用某種藥物時,往往會提到自己的年齡,性別等信息。傳統模型基于規則或關鍵字匹配,如將說明書中提到的“成年人”作為關鍵詞,但這樣就無法匹配上病人所提供的信息。而通用大模型可以精準地理解到,18歲等同于成年人,將二者匹配到一起,告知病人正確的藥品使用說明。
同時,對于通用大模型強大的舉一反三能力,肖仰華表示,假設傳統模型能解決A任務,也能解決B任務,但它解決不了A+B的任務。通用大模型則不然,在一些復雜任務和組合任務中,它擁有泛化問題的能力。“只要給它有關新任務的合理指令、少許示例,它就能產生期望輸出,無需高成本標注數據。”
肖仰華還稱,通用大模型擁有對復雜系統的認知能力。“它可以模仿人類專家做評估,節省極大的人力成本;可以迅速搜集想要的數據做成圖表,一鍵式完成數據分析;甚至可以診斷疾病,雖然專業領域上還有待提高。”
▍機遇與挑戰
“大模型對toB市場意義非常重大,它是一次智能引擎的升級。”肖仰華認為,現在很多行業真正解決不了的是跨系統、跨邊界、跨層級、跨模塊的問題,而大模型的跨學科認知能力使把這些問題可以交給大模型成為可能。
肖仰華表示,從傳統的小模型、知識工程為大模型的過程中,一定要重視、合理定位大模型對千行百業帶來的機會。
談及大模型面向企業服務的機會時,肖仰華稱要重視以下三個方面:
一是大模型需要與現有企業流程無縫融合,需要與現有工具或接口的有效銜接;
二是大模型需要與員工、專家有效協同;
三是大模型需要領域知識注入,以解決“幻覺”問題。但是,企業的決策是復雜的,絕非簡單的聊天場景所能勝任。“企業做決策需要非常豐富的專業知識,復雜的決策邏輯,宏觀的研判能力、綜合任務的拆解、嚴密精細的規劃、復雜約束的取舍和未知事務的預見等等,而通用大模型在這些方面的應用還有待挖掘。”
同時,肖仰華還提到了通用大模型的問題——“幻覺”現象以及缺乏領域“忠實度”:
“大模型會一本正經地胡編亂造一些虛假事實,這種虛假的“真實”產生的后果是極其嚴重的,譬如金融領域的投資、醫療方面的數據,一個小數點之差就有可能釀成大錯。
“而且,該問題難以解決。因為通用大模型本質上是統計模型,其自身無法從根本上解決這一問題,增大模型規模和訓練量只能一定程度上緩解該問題。
“此外,通用大模型對于領域給定的數據缺乏忠實度,往往自己利用它基礎模型學到的能力去發揮和創造,未按給定內容回答。”
在通用大模型已經內卷成“紅海”的今天,肖仰華認為,大模型到底帶來了哪些新的場景、新的應用值得深刻反思。
事實上,場景大模型以及行業和領域的大模型依舊是一片藍海。“從通用往行業、往場景、往專業去深耕,是大模型與千行百業的深度融合之路。”
針對場景化的大模型,肖仰華稱,如財務、客服、HR等場景的大模型往往只需要大模型的通識能力加上少量的崗位培訓,即可勝任。“這實際上可能是變現最快的一種大模型,值得關注。”
再者如物流行業的表單大模型等專業大模型,肖仰華亦認為很有潛力。“許多公司有這方面的需求,可以發展專業大模型,開辟出有競爭力、有優勢的大模型賽道。”
▍大模型不能停留在“煉金術” 而要成為科學
事實上,大模型要想往千行百業成為一個行業專家,仍然要付出巨大的代價,“我們要把大模型從通識走向專識,再讓它能夠學會工具,再能夠去實踐和反饋、優化,最終才能養成一個行業的專家。”
對于目前國內大模型研究,肖仰華做了一個形象比喻:“像古代研究煉金術,把數據往煉丹爐(GPU服務器)那里一丟,然后祈禱能夠煉出模型,但對何種數據產生何種訓練效果等訓練細節并不清楚。”
肖仰華認為,標簽化的語料很關鍵,“研究在什么標簽的語料喂養下的大模型能夠形成什么樣的能力,能夠幫助我們理解大模型背后的煉制機制。國內有很多企業注意到了這點,但真正去做的,少之又少。”
此外,肖仰華表示,要意識到大模型的發展是一個循序漸進的過程,加強對大模型的評測能夠幫助掌握模型的發展水平。“要合理定位、正確認識大模型,積極開辟新賽道,重視大模型的成本和價值,促進大模型與千行百業的深度融合。”
在演講的最后,肖仰華稱,大模型不能停留在“煉金術”,而是要成為一個科學,才能持續發展。而大模型要想真正成為一個科學,最關鍵的仍在于借鑒人腦的功能分區理論研究大模型的功能集約方法,借鑒人類的認知發展理論研究大模型的煉制原則,借鑒人類的情商與智商評測理論研究大模型的評測方法,所以對人類智能本身的理解對大模型的研究具有積極意義。“非常期待在大家的共同努力下,盡快讓大模型從現在的'煉金術'階段成為一個嚴肅的科學。”
- 免責聲明
- 本文所包含的觀點僅代表作者個人看法,不代表新火種的觀點。在新火種上獲取的所有信息均不應被視為投資建議。新火種對本文可能提及或鏈接的任何項目不表示認可。 交易和投資涉及高風險,讀者在采取與本文內容相關的任何行動之前,請務必進行充分的盡職調查。最終的決策應該基于您自己的獨立判斷。新火種不對因依賴本文觀點而產生的任何金錢損失負任何責任。