華夏銀行王彥博:人工智能在金融領域應用面臨小樣本學習問題
11月9日,由南方財經全媒體集團指導、21世紀經濟報道主辦的“第十九屆21世紀金融年會”在北京召開。年會期間同步舉辦了以“問道數字金融新方向”為主題的閉門研討會,來自北京大學國家發展研究院、商業銀行、消費金融公司、金融科技公司的10余位數字金融領域業內人士出席并發言交流。
華夏銀行信息科技部副總經理王彥博表示,今年全國兩會政府工作報告中提出要深化大數據、人工智能等研發應用,開展“人工智能+”行動,打造具有國際競爭力的數字產業集群。中國人民銀行印發的《金融科技發展規劃(2022—2025年)》也明確提出,要抓住全球人工智能發展新機遇,以人為本全面推進智能技術在金融領域的深化應用。實際上,商業銀行已廣泛應用人工智能技術,在精準營銷、智能風控、智慧經營、依法合規等諸多業務場景及流程環節構建了大量人工智能模型。
不過,王彥博也指出,商業銀行在某些特定領域可能面臨著數據樣本量不足的問題,導致現有的人工智能技術失效。比如,針對某類業務的細分場景構建模型,雖然整體的數據樣本量較大,但是細分后的數據樣本量可能變得很小。又比如,“冷啟動”是商業銀行開展新業務時不可逾越的一個階段,此階段業務數據樣本正處在逐漸累積的過程中。在上述情況下構建具有較強判別能力的智能模型是金融機構面臨的一個問題。這就引發了一個思考,是否只有大數據才能驅動人工智能,若沒有足夠量的數據樣本就意味著無法實現人工智能了嗎?顯然,無論數據樣本量如何都不會影響人們追求和獲得人工智能能力的決心,因此小樣本學習新興技術應運而生。
華夏銀行信息科技部副總經理王彥博受訪者供圖
六方面破解小樣本學習問題
華夏銀行提出了解決小樣本學習問題的“6M”框架方法論,并在《銀行家》期刊上發表相關文章。
一是基于專家經驗的小樣本學習(Man-based few-shot learning),即依托業務專家經驗形成規則來構建模型,常見的技術方法包括規則模型、評分卡模型、層次分析法模型、社交網絡與知識圖譜模型等。
二是基于數據算料的小樣本學習(Material-based few-shot learning),即通過增加數據量將樣本擴充為大樣本,常見的技術方法有兩類:一類是基于數據本身,通過樣本增強的方法(如SMOTE、GAN等)擴充樣本量進行建模;另一類是在“數據可用不可見”的思想下,利用聯邦學習技術來實現擴充樣本進行建模。
三是基于模型泛化的小樣本學習(Model-based few-shot learning),即從模型的角度入手,利用某類數據集學會一種學習的機制(如每個類別分類器參數的產生機制等),然后遷移到目標小樣本數據集中,通過參數微調使得模型具有更強的泛化性,能夠快速進行新類的學習,常見的技術方法包括遷移學習、元學習等。
四是基于計算方法的小樣本學習(Method-based few-shot learning),即聚焦算法創新,選擇合適的嵌入方法將數據的原始特征嵌入一個可分的空間,在新空間構造特征后進行建模,常見的技術方法包括支持向量機中的核函數法、分類關聯規則挖掘中的頻繁項集法和利用網絡進行特征嵌入法等。
五是基于仿真環境的小樣本學習(Environment-based few-shot learning),即在極少樣本甚至無樣本的條件下,通過梳理業務傳導邏輯,構建端到端的數字孿生仿真模擬環境,并通過強化學習相關技術進行建模。
六是基于計算機發展的小樣本學習(Machine-based few-shot learning),即基于量子科技發展將經典計算機升級為量子計算機,從而對小樣本數據集直接構建量子算法模型。實證表明,該類技術方案在解決小樣本學習問題上較經典機器學習方案有著明顯的優勢。
開展群組訓練推進小樣本學習應用研究
針對小樣本學習問題,在基于數據算料的小樣本學習方面,王彥博還提出了一種新的解決方案——群組訓練(Group Training),它同時具備樣本增強和特征增強技術特性,能夠有效提升小樣本學習任務的模型準確性。王彥博表示,平行于群組訓練,華夏銀行前段時間還提出了群組測試(Group Testing)技術方案,將核酸檢測或血液檢測所使用的Group Testing方法引入到機器學習和模式識別任務上,使人工智能模型在推理測試環節的時間大幅度縮減,有效節省了計算能耗,對人工智能向綠色低碳發展有一定借鑒意義。
關于群組學習(Group Learning)的概念,是指在機器學習和模式識別模型訓練或推理測試過程中,將訓練數據集或測試數據集中的數據樣本進行多樣本合并組合,而后面向新生成的合并組合樣本開展Group Training(群組訓練)或Group Testing(群組檢測/測試)的新興技術方案。
(文章來源:21世紀經濟報道)
- 免責聲明
- 本文所包含的觀點僅代表作者個人看法,不代表新火種的觀點。在新火種上獲取的所有信息均不應被視為投資建議。新火種對本文可能提及或鏈接的任何項目不表示認可。 交易和投資涉及高風險,讀者在采取與本文內容相關的任何行動之前,請務必進行充分的盡職調查。最終的決策應該基于您自己的獨立判斷。新火種不對因依賴本文觀點而產生的任何金錢損失負任何責任。