首頁 > AI資訊 > 最新資訊 > 專訪王曉航:大模型需落地千行百業,生態繁榮才能擺脫增長焦慮

專訪王曉航:大模型需落地千行百業,生態繁榮才能擺脫增長焦慮

新火種    2023-12-17

螞蟻集團副總裁、金融大模型負責人王曉航

大模型闖入大眾視野一年后,“百模大戰”進入下半場,如何落地產業、成為大眾高頻剛需,已是大模型的重要打磨方向,也成為全球范圍內“大模型競賽”的第二賽點。

今年9月,螞蟻集團在上海“外灘大會”上發布了自研的螞蟻金融大模型,展示了從基礎大模型到行業大模型以及產業應用的全棧布局。過去一年,螞蟻摸索大模型在數字金融領域的研發與應用落地,測試基于自研金融大模型的智能理財助理支小寶2.0,以及面向金融產業專家的智能業務助手“支小助”。可以說,在產業落地進展上,螞蟻金融大模型的一舉一動,極具代表性。

近日,螞蟻集團副總裁、金融大模型負責人王曉航在和媒體訪問交流時,就大模型的國內外現狀、算法、應用、監管等話題分享了自己的看法。作為螞蟻金融大模型的負責人,這是王曉航至今最為全面的一次交流分享,也代表了螞蟻在大模型領域的判斷和思考。以下是對話要點:

一、打造超級生態,才能擺脫增長的焦慮

問:如何看待OpenAI增長放緩?

王曉航:從模型能力來講,共識是模型架構是趨于統一的,所以模型能力的演進是靠數據驅動的。今天比較大的問題是,互聯網上公開可得的高質量圖文數據基本上已經開始枯竭了。解決路徑有兩條:

一是模型架構如何優化來對齊多模態數據,包括圖文、視頻、IoT等一系列多模態數據,打破數據規模、數據質量瓶頸,這是各大AI大模型廠商現在最主要的方向之一。

二是落地,OpenAI正在尋找產業數據合作伙伴,這意味著公開可得的數據、高質量的數據耗盡之后,千行百業專業領域里的高質量私域數據規模,重要性變得和開放數據不相上下。這部分產業數據,怎么像自來水一樣源源不斷接入到大模型也很關鍵,這不存在捷徑,要跟行業一起努力。

用戶增長放緩是事實,早期爆炸式增長不是可持續的。更主要的問題是,AGI作為中心化的常識問答產品,沒法成為大眾高頻剛需。大模型要融入千行百業,讓產業從AI化中收獲價值,才能成為廣泛的剛需,這是下一步的增長空間。整個大模型行業,不應只是一個簡單的中心化的超級AI,而是一個千行百業組成的超級生態。所謂超級生態,就是更通用強大的模型、更高效的開發、開發之后集成到各產業中。現在還沒有特別成功的產業案例,但可能會在未來一兩年發生,這也是行業趨勢。

問:誰能夠成為OpenAI的真正挑戰者?

王曉航:五年前,很少有人預料到OpenAI會成為AI領跑者。所以挑戰者有可能是像Llama這樣背靠開源生態的開源大項目,像谷歌這樣有數據飛輪、有充沛資源的大公司,也有可能是另一個“OpenAI”,也就是專注在算法架構和深度學習領域潛心鉆研的創業公司。

問:未來一年,大模型的多模態化預計會演化到什么程度?

王曉航:多模態是現在行業重點方向之一,海量多模態數據之間的理解和對齊技術還會快速進步。高維度數據,不只是圖文、視頻,還有IoT和物理世界連接的研究也會慢慢浮出水面,也就是傳感、控制這些模態的數據也會跟自然語言的語義空間對齊,在AI領域這個技術叫grounding(落地),怎么讓語言從抽象的符號到真正連接現實世界,讓AI能在所在的環境里感知和行動,然后產生更多新能力,比如自動駕駛能力 、機器人能力,真正端到端地解決實際業務問題,我覺得未來一兩年會有大突破。

比如自動駕駛,以往是多個模塊進行拼接來訓練,但現在像特斯拉的自動駕駛主要在研究端到端的訓練,把雷達、視頻、駕駛數據和傳感器的大量車速、剎車控制數據當作序列數據,來學習它們之間的對應和關聯,在海量數據中相互映射后更好理解和預測。這些多模態數據之間的對齊已經超過了自然語言能夠描述的知識。所以,多模態數據不只是文生圖轉換,更重要的是如何跟現實世界連接,這在未來會打開另一個新的空間。

問:大語言模型下一步的進化方向是什么,有什么挑戰?

王曉航:有三個方向,第一就是剛剛講的多模態。第二是落地產業,端到端解決產業問題的能力,也就是以Agent為代表的技術。比如金融行業有大量嚴謹的知識,一款保險能不能買、能不能賠,大模型本身很難在嚴謹領域里跟這些知識對應,模型本身抽象的符號怎么跟現實世界中的物理動作、控制、概念進行映射很重要,大模型在專業領域里精準調用這些知識,是Agent要解決的一個問題,功能和工具的調用也很重要。Agent其實核心就需要解決符號連接環境的問題,一個很強大的模型作為一個中樞,跟場景、數據、服務連接在一起,無縫解決用戶需求。

第三是可靠性,模型能力越強大,可靠性問題越關鍵。OpenAI前兩周的動蕩中,非常受爭議的是超級對齊,前首席科學家想要花4年時間、20%的算力,系統性解決對齊問題。

其實大模型要真正進入產業,最終不是形成一個超級APP,而是一個超級生態,對可靠性要求的挑戰非常大。大模型非常擅長創作性的工作、文科生的工作,因為沒有對錯,文無第一,武無第二。但像醫療、交通、金融這些專業領域沒有很高的容錯空間,所以如何解決可靠性比大家想象的要復雜很多,不是簡單的對齊和幻覺問題,它要遵循現實社會和現實行業的規范、規章、價值觀、專業性、事實性,才能落地。不存在捷徑,我們只能通過系統工程的方式去解決可靠性問題,也有探索在大模型底層如何做好進一步的對齊。

問:OpenAI召開首屆AI開發者大會后,AI領域的小公司還有沒有機會?

王曉航:就像App Store,在移動互聯網領域成功的不只是iPhone和Android,每個行業都有現象級的產品,千行百業也迸發出非常多的創新,電商、生活服務、金融、內容媒體都長在移動互聯網生態上。擁抱AI的時代,很大程度上不需要重造操作系統和大模型,它作為一個好的開發者生態,自然而然會開發出新的應用。OpenAI也需要從一個超級APP轉化成一個超級生態,生態的繁榮才能真正意義上帶來增長,給所有人創造增量價值。這是一個商業的必然,從一個超級APP變成一個超級生態,才能擺脫增長的焦慮。

問:未來一年,中國的百模之戰會如何演化?

王曉航:我覺得未來通用且開放的大模型,會更加收斂和集中,大部分大模型廠商、創業公司會走向第二層競爭——進入產業,這會非常多元化。現在產業落地的進展是相對滯后的,百模大戰投入了大量資源,很大程度上是造輪子,但產業落地沒什么特別好的案例。比如金融領域利用大模型開發價值,沒有看到特別好的案例,明年可能開始會有很多卷大模型的廠商進入到行業中尋找自己的發展空間。

二、大模型落地千行百業,最成功的會是創造型和知識密集型產業

問:未來一年,會出現一個現象級的生成式AI應用嗎?

王曉航:肯定會,但不知道是什么時間出現。下一個應用不會是GPT本身,應該會在產業中,產業里會出現不止一個應用,各個行業都會有,比如電商、金融。我們就在研發和測試基于大模型的智能理財助理支小寶。

數字化金融服務已經非常豐富多元了,但對大眾來說還是過于復雜,怎么把簡單、專業、智能的財富管理服務帶給客戶,這樣的應用有非常深的價值,下一步服務體驗升級只有通過AI才能實現。每個行業都在等待自己的AI超級應用,誰在產業里更有數字化基礎,誰把行業和技術結合得更緊密,誰就能夠帶來這樣的產品。

問:大模型落地最成功的產業,會是哪些?

王曉航:有兩類,一類是創造型產業,比如設計、文娛、游戲;另一類是高知識密集型行業,比如金融、醫療、法律。大語言模型是一個強大的參數化的世界知識的容器,它能媲美、賦能,甚至某種程度上替代一部分知識型工作者的職能。

問:大模型落地產業的最大難點是什么?

王曉航:大模型是基于全網可得的公開數據所訓練的,理解和生成能力非常強,但遇到專業嚴謹行業時有非常多挑戰。通用大模型在專業通識方面是短板,比如金融專業性很深,各種金融決策的復雜性和嚴謹性要求很高,醫療行業更加復雜嚴謹。比如理財領域,做家庭資產配置保障計劃,不是簡單推薦,而是計算偏離度、風險集中度、風險等級、承受能力,像這樣的決策不是大模型擅長的,它無法學習,即使有足夠的數據,它的嚴謹度和計算,也遠遠達不到今天的行業要求。醫療、金融等強監管行業對可靠性要求極高,我講的可靠性不只是“幻覺”,還有合規性、適當性、倫理問題等,涉及每個行業的價值主張。

如果這三個問題不解決,大模型在嚴謹產業落地時潛力無法發揮。如何解決這三個問題?一是大模型要跟領域內的專用小模型結合,比如資產配置,在理解用戶需求后調動資產配置工具,而不需要讓大模型直接計算資產該怎么配置。二是結構化的知識圖譜很重要,比如我們為了做好醫療理賠工作,要建非常完備的醫療和保險知識圖譜,在大模型訓練過程中注入,降低幻覺,提高專業性,在應用過程中優先考慮知識圖譜跟大模型怎么結合。檢索增強技術也非常有效,在專業領域中定位內容以后進行解答,就像從一本專業書籍中找答案,這些技術都可以大幅提高大模型專業性和真實性。這是一個系統工程。

問:螞蟻的金融大模型目前什么進展?

王曉航:在大模型時代之前的小模型時代,我們已經全面AI化了,涉及風險管理、智能理賠、智能助理、智能營銷等環節。但大模型的到來,還是給我們帶來很大震撼,因為它在很多金融場景里能夠輕易刷新小模型時代的最好表現,意圖理解、定性分析、量化分析等領域已經超過人工。

小模型時代,每一個應用場景都要進行非常深的端到端定制,算法工程師和時間成本很昂貴,大模型統一了算法架構,一個模型經過簡單的微調和適配后可以解決一大票問題,做得比以前更好,提高企業經營效率,所以加速創新,能讓人聚焦在專業有深度的創造性工作上。專業化的金融服務也會有一種替代性的體驗。現在所有移動互聯網的交互都以圖形界面(GUI)為主,未來的服務要通過多模態的交互、語言的交互來完成,怎么跟移動互聯網的圖形界面融合,形成一種新的界面和體驗,可能是未來兩年會發生的。

螞蟻的金融大模型,在理財和保險業務上,已經進行了大半年深度內部測試。我們希望能給用戶帶來代際上有區別的不同服務體驗,在金融資訊、金融通識方面做到有問必答,在幾百款數字化工具上做到有求必應,定制個性化服務方案,改變圖形界面的交互方式。

在B端,我們為理財師、分析師、銷售人員、理賠專家團隊、內容運營創作團隊在打造智能業務助理“支小助”,包括投研版、理賠版、服務版等。數字金融可以看作一個大模型落地產業的大樣板間,我們雖然是剛起步,但也看到了一些快速迭代,在大模型的沖擊下打開了眼界。

三、安全、隱私、倫理、可解釋性會持續成為全球監管重點

問:未來一年,全球范圍的AI監管,預計會出現哪些進展?

王曉航:安全、隱私、倫理、可解釋性,會持續成為監管的關注對象。醫療、金融等專業領域有準入規范,從業人員需要持證上崗,專業能力要經受考核。所以現在有個趨勢是,大模型深入到這些產業時也不能被豁免,它需要準入以后才能落地產業,相當于大模型要通過職業考試達到一定準入門檻,這是以前的AI所不存在的一個問題。

問:除了生成式AI,AGI是否會存在其他形式?

王曉航:生成式AI只是這一波技術革命的中樞,但最終要實現AGI、端到端解決現實世界的問題,需要一個系統工程組合技術。大模型如果真的要往通用智能和更高級的智能演進,比如具身智能,就需要跟現實世界進行連接、互動,這包括多模態理解、傳感和交互技術。也已經有其他AI的分支技術被吸收到大模型的技術范式里了,比如強化學習。

問:大模型的下一階段會是什么,是超級智能體嗎?

王曉航:Agent的本質是一個智能在環境中自治的框架,有較多可選的技術組合,可以把很多標簽和新技術往Agent的框架里塞,但最終的本質還是AI要解決現實世界的任務。目前最有希望的方式是以大模型為中樞,提供落地的連接、知識存儲,思考和規劃的框架,這是產業落地的一個最關鍵的技術載體。

問:對于應對AGI,你最想知道答案的一個問題是什么?

王曉航:價值對齊。一旦有一天大模型開始有自主意識以后,最重要的是價值對齊,以及對人類的系統性保護。所謂價值對齊,就是大模型有自主意識后,當它的智能和能力媲美和超過創造者時,它需要以什么樣的態度來看待創造者。超級智能在智力和能力上比人更強時,我們如何跟它們共存,這是超級對齊的本源,也就是我們作為一個物種跟更高階的新物種一起,安全利用、共處、生存和發展。當然,這是高級階段的問題,現在大模型首先要能落地產業。

相關推薦
免責聲明
本文所包含的觀點僅代表作者個人看法,不代表新火種的觀點。在新火種上獲取的所有信息均不應被視為投資建議。新火種對本文可能提及或鏈接的任何項目不表示認可。 交易和投資涉及高風險,讀者在采取與本文內容相關的任何行動之前,請務必進行充分的盡職調查。最終的決策應該基于您自己的獨立判斷。新火種不對因依賴本文觀點而產生的任何金錢損失負任何責任。

熱門文章