從“卷”參數到“卷”應用大模型直擊金融業務“最后一公里”
金融行業數據資源豐富,實踐場景廣泛,擁有與大模型深度結合的前景。而作為與數字技術最緊密的試驗田,金融機構對于大模型的態度是高度關切但投入審慎。
一位國有大型銀行人士認為,關鍵還是要看通過大模型能否突破此前業務中無法解決的效率或準確性問題。騰訊云計算(北京)有限責任公司(以下簡稱“騰訊云”)總裁邱躍鵬則指出,大模型并非越大越好,金融機構需要在場景中去“裁減”到最適合自己參數的模型,追求效率和成本的最優解。
《中國經營報》記者注意到,在近期披露的一系列大模型進展中,科技公司更多開始瞄準金融業務的“最后一公里”。11月23日,騰訊云發布金融行業大模型解決方案。同日,北京中關村科金技術有限公司(以下簡稱“中關村科金”)發布企業知識大模型、開發平臺,以及AIGC應用等多項產品。更早前,螞蟻科技集團股份有限公司(以下簡稱“螞蟻集團”)披露百靈大模型已完成備案,基于該大模型的多款產品已陸續完成內測,將向公眾開放。
對大模型的“理解誤區”
波士頓咨詢(BCG)在2023年8月發布的《銀行業生成式AI應用報告(2023)》(以下簡稱“《報告》”)中指出,銀行業應用生成式AI主要遵循兩大類價值創造邏輯:一是替代人工,即接受大量重復性、簡單基礎的任務,以釋放運營類人力資源;二是賦能人工,利用生成式AI的“對話”和“創造”能力,以AI為助手放大關鍵節點“人”的產能,賦能專業內容形成和基礎管理環節。生成式AI的應用場景可以貫穿于銀行全產業鏈的各個環節中,包括營銷、獲客、投研、風控等。
《報告》認為,未來生成式AI在銀行業的落地進展,一方面取決于中文通用大語言模型的發展,另一方面基于通用大模型針對銀行業的適配與優化。
自今年以來,國內大模型市場已經經歷了從基礎大模型、行業大模型到大模型應用的“三連跳”。騰訊研究院今年7月末的一項調研數據顯示,國內參數在10億規模以上的大模型數量已達到116個,其中金融行業大模型約18個。
中國信息通信研究院云計算與大數據研究所人工智能部主任曹峰表示,過去一年大模型發展極速,從聚焦基礎能力,到聚焦大模型的開發平臺,再到基于大模型應用生態的構建。目前,行業最需要解決的是大模型如何落地、運營以及如何在產業環境中進一步發揮作用。
對金融機構而言,“在產業環境中發揮效果”無疑是要走向業務“最后一公里”。但事實上,由于算力、數據、技術的一系列高門檻,不少中小金融機構對此仍是“望洋興嘆”。
一家中部省份城商行人士向記者表示,銀行對大模型很關注,但感覺和小機構實際需求比較遠,成本也太高,行內態度主要是先看頭部大行怎么實踐,再選擇如何跟隨。
在邱躍鵬看來,目前行業的一個誤區在于:當大家想到大模型時都想去追求大參數、大size,覺得越大越好。但他的團隊在實踐中發現,很多場景中動輒一兩千萬元的成本不是每家企業都能承受的,必須考慮ROI(投資回報率)。
以金融業務中重要的智能識別技術(OCR)為例,金融行業的票據、單據處理需要大量非結構化的信息進行專業的處理,傳統OCR深度學習模型需要有大量的定制,要做票據的檢測、識別、程序化,錯誤率非常高。
邱躍鵬透露,OCR的一站式學習平臺和大模型可以解決上述問題,但在參數選擇和精調程度上要求很高?!叭绻炎R別出來的文字灌到大模型中去做更好的圖像理解、文字內容理解,不一定是最高效的解決辦法。當我們在實踐中把參數適當降下來后發現它對算力要求降低了卻能很好解決場景問題。”他表示。
記者調研采訪了解到,當前金融機構部署大模型主要有三種方式,除了極少機構有能力進行獨立自研,更多采用的是與第三方合作形式,其中包括與通用或行業大模型合作再進行微調,也包括從云端調用接入大模型API(應用程序編程接口),完成私有化部署。而科技背景的平臺型公司作為輸出技術的主力軍,通常在母公司的通用大模型基礎上開發新的行業大模型,金融機構在實踐中通常可以根據不同細分場景的業務需求,靈活選擇各類大模型,降低大模型使用成本。目前,基于百度的文心一言、阿里的通義千問、騰訊的混元大模型,都有面向金融行業構建生態合作伙伴的部署。
以騰訊云為例,其推出的金融行業大模型解決方案包含四層架構——算力層、平臺層、大模型層以及應用層。在大模型層,通過模型商店MaaS,支持接入騰訊混元大模型、金融行業大模型及20多個主流開源模型。在應用層,基于金融行業大模型的能力,結合金融行業前中后臺業務場景,打造一系列智能應用。
騰訊云副總裁、騰訊云智能解決方案負責人王麒在接受媒體采訪時表示,不同的金融企業可以根據自身的投入成本以及場景復雜度,選擇在不同的點切入自己的金融行業大模型,在能效比方面尋求一個最優的選擇。
他還透露,在上述OCR技術使用場景中,通過領域精調和訓練,實現了參數和場景適配的較好效果——將交易的票據提升到了95%,同時降低了人力的成本,單張單據的處理時間從以前的五分鐘降到了五秒。
一位國有大型銀行研發中心負責人在近期談及大模型發展原則時也表示,數據是核心,但數據不是越多越好,高質量訓練數據才是關鍵;算力是基礎,算力瓶頸是挑戰也是機會,開源節流才是關鍵;場景是關鍵,但場景建設也需要合理布局。
機構路徑選擇分化
大型企業傾向從上到下提供一攬子解決方案,行業中小機構則傾向通過生態合作來實現自己的大模型解決方案輸出。
具有清華技術背景的北京智譜華章科技有限公司(以下簡稱“智譜AI”),過去一年推出了多種量級的ChatGLM大模型,以適配不同市場需求。在智譜AI總裁王紹蘭看來,大模型不是天生就可以拿來賦能行業,需要大量的行業生態合作伙伴一起做工程開發。
以中關村科金為例,其選擇通過與優秀的底層通用大模型企業合作,通過領域知識庫注入領域知識,在開源的通用大模型基礎上微調出適合金融等行業的領域大模型。在具體的業務產品構建上,通過企業知識大模型,支撐平臺領域大模型工廠、領域知識庫工廠完成“行業化”過程,繼而輸出智能營銷、智能服務、智能運營、超級員工四類產品。
中關村科金技術副總裁張杰向記者透露,大模型價值的根本在于多樣化業務場景的實際應用,且成本可負擔、安全性可控、業務深耦合。他傾向認為,企業應用大模型不一定用千億級別規模參數非常大的模型,關鍵是依據每個企業的高頻需求讓企業可以用上,并且成本可負擔。
財富管理被普遍認為是生成式AI有望最先得到廣泛應用的場景。在國際市場上,摩根士丹利已經開始采用GPT 4.0來優化財富管理咨詢流程,幫助約1.6萬名財富管理顧問。
諾亞控股有限公司數據管理部總經理孫甜指出,高凈值客戶開戶涉及資料整理和流程審批復雜,需要高水平的24小時客服支持,通過中關村科金ChatPilot知識助手賦能智能客服,客服系統問答意圖識別和回復的準確率大幅提升,文本客服運營工作量減少70%以上,回答效果可以提升50%以上。
融360(北京融世紀信息技術有限公司)則基于騰訊云的底座,開發出全鏈或者一站式的解決方案。融360創始人、CEO葉大清認為,大模型在實際應用中不能為了做而做,需要考慮業務簡單方便和底層大模型的兼容能力。
在王麒看來,做底層通用大模型是一個“深水區”,需要多年的技術積累。最終,行業應該是少數幾家頭部廠商能做底層大模型,更多合作伙伴加入進來做精調,即做好“最后一公里”,來實現應用落地。
騰訊云副總裁胡利明在接受采訪時則建議,行業的機構以及合作伙伴可根據自身需求甄選場景和試點——從場景價值、需求頻次、技術三個維度進行整體的選擇,如營銷、客服、風控等需求頻次多、價值大、技術成熟度高的場景可先進行試點,而輿情監控、智能投顧、投研以及代碼助手則可作為第二優先級。
至于此前被認為大語言模型較難被突破的風控環節,胡利明也透露,騰訊云基于行業大模型以及金融風控的經驗,通過大量的預訓練和知識蒸餾形成Level 2的風控模型。“我們和某頭部股份制銀行合作的信用卡風控場景,在它的活動周期內貸款環節查詢量有500萬次,最終查到5萬次的詐騙行為,幫助客戶避免了超過億元的損失。”
(文章來源:中國經營網)
- 免責聲明
- 本文所包含的觀點僅代表作者個人看法,不代表新火種的觀點。在新火種上獲取的所有信息均不應被視為投資建議。新火種對本文可能提及或鏈接的任何項目不表示認可。 交易和投資涉及高風險,讀者在采取與本文內容相關的任何行動之前,請務必進行充分的盡職調查。最終的決策應該基于您自己的獨立判斷。新火種不對因依賴本文觀點而產生的任何金錢損失負任何責任。