首頁(yè) > AI資訊 > 最新資訊 > 上海財(cái)經(jīng)大學(xué)聯(lián)合財(cái)躍星辰開源首個(gè)金融領(lǐng)域R1類推理大模型Fin-R1:僅7B參數(shù),逼近DeepSeek滿血版效果

上海財(cái)經(jīng)大學(xué)聯(lián)合財(cái)躍星辰開源首個(gè)金融領(lǐng)域R1類推理大模型Fin-R1:僅7B參數(shù),逼近DeepSeek滿血版效果

財(cái)聯(lián)社    2025-03-22

財(cái)聯(lián)社3月21日訊,近日,上海財(cái)經(jīng)大學(xué)張立文教授與其領(lǐng)銜的金融大語(yǔ)言模型課題組(SUFE-AIFLM-Lab)聯(lián)合界面財(cái)聯(lián)社旗下大模型科技公司財(cái)躍星辰開源發(fā)布首款金融領(lǐng)域R1類推理大模型Fin-R1。

Fin-R1僅7B參數(shù),但在權(quán)威評(píng)測(cè)中,與參數(shù)量為671B的行業(yè)標(biāo)桿DeepSeek-R1平均分差距僅3分,以75.2分的平均得分位居評(píng)測(cè)榜單第二。Fin-R1通過(guò)構(gòu)建高質(zhì)量金融推理數(shù)據(jù)集與兩階段混合框架訓(xùn)練,驗(yàn)證了金融領(lǐng)域R1 類推理大模型的可復(fù)現(xiàn)性,并探索出了金融領(lǐng)域“數(shù)據(jù)構(gòu)建-模型訓(xùn)練-性能驗(yàn)證-模型部署-場(chǎng)景應(yīng)用”的全閉環(huán)鏈路,將推動(dòng)大模型在金融領(lǐng)域加快落地。

Github地址:https://github.com/SUFE-AIFLM-Lab/Fin-R1

技術(shù)報(bào)告:https://arxiv.org/abs/2503.16252

模型地址:https://huggingface.co/SUFE-AIFLM-Lab/Fin-R1

應(yīng)用圖景:重構(gòu)金融業(yè)務(wù)鏈條,貫穿金融生態(tài)應(yīng)用

Fin-R1是一款專為金融領(lǐng)域打造的智能推理大模型,能夠在銀行、基金、保險(xiǎn)和證券等多個(gè)場(chǎng)景中大展身手。在銀行業(yè)務(wù)中,它可以精準(zhǔn)計(jì)算貸款利息、優(yōu)化財(cái)富管理方案;在基金投資中,它能輔助投資顧問(wèn)進(jìn)行資產(chǎn)配置,幫助用戶做出更明智決策;在保險(xiǎn)行業(yè),它能高效評(píng)估保單收益,預(yù)測(cè)市場(chǎng)趨勢(shì);在證券領(lǐng)域,它甚至可以參與量化交易代碼編寫,提升從業(yè)者的代碼效率。得益于高質(zhì)量數(shù)據(jù)的訓(xùn)練,F(xiàn)in-R1不僅能提供扎實(shí)的金融知識(shí)支持,還能進(jìn)行復(fù)雜的推理計(jì)算,在智能投研、市場(chǎng)分析和自動(dòng)化金融決策方面都具備強(qiáng)大能力。

圖1 Fin-R1應(yīng)用場(chǎng)景示例

Fin-R1工作流程速覽

Fin-R1的總體工作流程為:項(xiàng)目組首先通過(guò)構(gòu)建60k規(guī)模的金融推理數(shù)據(jù)集Fin-R1-Data,幫助模型重構(gòu)知識(shí)體系,然后采用“兩階段訓(xùn)練框架”塑造模型認(rèn)知和推理能力,最后在多個(gè)金融基準(zhǔn)測(cè)試上驗(yàn)證模型的性能突破,實(shí)現(xiàn)了從“數(shù)據(jù)構(gòu)建-模型訓(xùn)練-性能驗(yàn)證-模型部署-場(chǎng)景應(yīng)用”的完整技術(shù)閉環(huán)。

圖2 Fin-R1總體工作流程

數(shù)據(jù)構(gòu)建——破解知識(shí)碎片難題,構(gòu)建金融決策基石

圖3 Fin-R1數(shù)據(jù)生成流程

在金融領(lǐng)域,復(fù)雜的業(yè)務(wù)邏輯要求模型不僅理解碎片化知識(shí),更需要建立可驗(yàn)證的多步推理能力。然而,傳統(tǒng)的金融數(shù)據(jù)分散、標(biāo)注成本高,而且缺乏對(duì)復(fù)雜推理邏輯的針對(duì)性設(shè)計(jì),導(dǎo)致模型難以適配金融業(yè)務(wù)場(chǎng)景。

為將 DeepSeek-R1的推理能力遷移至金融場(chǎng)景并解決高質(zhì)量金融推理數(shù)據(jù)問(wèn)題,項(xiàng)目組利用Deepseek-R1(滿血版)針對(duì)涵蓋行業(yè)語(yǔ)料(FinCorpus、Ant_Finance),專業(yè)認(rèn)知(FinPEE),業(yè)務(wù)知識(shí)(FinCUGE、FinanceIQ、Finance-Instruct-500K),表格解析(FinQA),市場(chǎng)洞察(TFNS),多輪交互(ConvFinQA)以及量化投資(FinanceQT)的多個(gè)數(shù)據(jù)集進(jìn)行領(lǐng)域知識(shí)蒸餾篩選,構(gòu)建了約60k條面向?qū)I(yè)金融推理場(chǎng)景的高質(zhì)量推理數(shù)據(jù)集Fin-R1-Data。

該數(shù)據(jù)集涵蓋中英文金融領(lǐng)域的多維度專業(yè)知識(shí),并根據(jù)具體任務(wù)內(nèi)容將其分為金融代碼、金融專業(yè)知識(shí)、金融非推理類業(yè)務(wù)知識(shí)和金融推理類業(yè)務(wù)知識(shí)四大模塊,可有效支撐銀行、證券以及信托等多個(gè)金融核心業(yè)務(wù)場(chǎng)景。

為了保證數(shù)據(jù)質(zhì)量,項(xiàng)目組首創(chuàng)“答案+推理邏輯”雙輪打分機(jī)制,雙輪質(zhì)檢,嚴(yán)把數(shù)據(jù)關(guān)。

第一輪:用規(guī)則匹配和Qwen2.5-72B-Instruct對(duì)答案準(zhǔn)確性進(jìn)行打分,確保數(shù)據(jù) “零錯(cuò)誤”;

第二輪:深度校驗(yàn)推理邏輯的一致性和術(shù)語(yǔ)合規(guī)性,讓AI的“思維鏈條”嚴(yán)絲合縫。

第三輪:引入金融專家團(tuán)隊(duì)對(duì)關(guān)鍵數(shù)據(jù)進(jìn)行人工復(fù)核,保障訓(xùn)練數(shù)據(jù)高質(zhì)量。

數(shù)據(jù)分布及其總覽如圖4和表1所示:

圖4 Fin-R1數(shù)據(jù)分布

表1 Fin-R1數(shù)據(jù)量表

模型訓(xùn)練——“劃重點(diǎn)-考試-打分”模式給AI上"金融特訓(xùn)課",兩步打造金融決策專家

模型的整體訓(xùn)練框架如圖5所示。

圖5 Fin-R1模型訓(xùn)練流程

第一步:系統(tǒng)學(xué)習(xí)(SFT指令微調(diào))——學(xué)習(xí)思考模式

針對(duì)非推理類模型在RL訓(xùn)練過(guò)程中存在訓(xùn)練不穩(wěn)定等問(wèn)題,研究團(tuán)隊(duì)對(duì)AI進(jìn)行專項(xiàng)知識(shí)補(bǔ)課,像教學(xué)生一樣訓(xùn)練模型,讓非推理類模型掌握金融推理的基本功。使用金融推理數(shù)據(jù)集對(duì)模型進(jìn)行定向訓(xùn)練(SFT),使模型初步具備長(zhǎng)思維鏈思考模式,降低模型訓(xùn)練難度,保證訓(xùn)練穩(wěn)定性。

第二步:實(shí)戰(zhàn)優(yōu)化(RL強(qiáng)化學(xué)習(xí))——嚴(yán)控決策質(zhì)量

通過(guò)考試和專家打分(RL強(qiáng)化學(xué)習(xí)),不斷糾正AI在復(fù)雜場(chǎng)景中的判斷失誤,確保每個(gè)決策都經(jīng)得起推敲。在模型掌握基礎(chǔ)知識(shí)后,通過(guò)"考試+專家打分"機(jī)制(RL)持續(xù)提升專業(yè)性:

智能考官把關(guān):引入Qwen2.5-Max作為驗(yàn)證器用于檢查答案對(duì)錯(cuò),比傳統(tǒng)正則表達(dá)式方式準(zhǔn)確度更高。

雙軌打分制:采用“基于規(guī)則的格式獎(jiǎng)勵(lì) “和”基于模型驗(yàn)證的準(zhǔn)確性獎(jiǎng)勵(lì) “兩種獎(jiǎng)勵(lì)訓(xùn)練模型,實(shí)現(xiàn)金融文本生成“形神兼?zhèn)洹薄?/p>

特訓(xùn)成果:金融界的“最強(qiáng)大腦”

項(xiàng)目組采用了兩階段訓(xùn)練方法,在提升模型金融推理性能的同時(shí),有效降低了訓(xùn)練資源的消耗。經(jīng)過(guò)特訓(xùn)的Fin-R1模型,在金融推理任務(wù)中展現(xiàn)出了卓越性能。Fin-R1能夠完整地呈現(xiàn)思考過(guò)程,不僅為金融決策提供深入洞察,更為金融投資、風(fēng)險(xiǎn)管理、智能投顧以及量化交易等金融業(yè)務(wù)領(lǐng)域提供了可靠技術(shù)底座。未來(lái),這樣的“金融特訓(xùn)營(yíng)”模式有望在更多專業(yè)領(lǐng)域復(fù)制推廣。

性能驗(yàn)證——專業(yè)場(chǎng)景性能超越,驗(yàn)證技術(shù)閉環(huán)價(jià)值

在覆蓋多項(xiàng)金融業(yè)務(wù)場(chǎng)景的權(quán)威評(píng)測(cè)中,項(xiàng)目組考慮模型的推理能力與資源消耗,將Fin-R1與涵蓋輕量級(jí)和高性能的不同模型進(jìn)行了全面評(píng)估。最終Fin-R1以僅7B的輕量化參數(shù)規(guī)模展現(xiàn)出顯著的性能優(yōu)勢(shì),以75.2的平均得分位居第二。

Fin-R1全面超越同規(guī)模參評(píng)模型,與平均得分第一的DeepSeek-R1差距僅為3分,同時(shí)較70B參數(shù)模型DeepSeek-R1-Distill-Llama-70B(69.2)超出6分。此外,F(xiàn)in-R1在聚焦真實(shí)金融表格數(shù)值推理任務(wù)的FinQA以及多輪交互場(chǎng)景的ConvFinQA 兩大關(guān)鍵任務(wù)測(cè)試上分別以76.0和85.0的得分在參評(píng)模型中登頂?shù)谝?,展現(xiàn)出了模型在金融推理場(chǎng)景及金融多輪交互場(chǎng)景中的強(qiáng)大處理能力。

Fin-R1的評(píng)測(cè)還展現(xiàn)出模型在處理財(cái)務(wù)報(bào)表重組、財(cái)務(wù)比率交叉驗(yàn)證時(shí)的強(qiáng)大數(shù)值推理能力。精準(zhǔn)覆蓋金融行業(yè)對(duì)可解釋性、合規(guī)性、數(shù)值嚴(yán)謹(jǐn)性的核心訴求。具體評(píng)測(cè)結(jié)果如下:

表2 Fin-R1及其他模型在各數(shù)據(jù)集上的評(píng)測(cè)表現(xiàn)

模型部署

Github現(xiàn)已提供“開箱即用”的本地化部署方案,只需運(yùn)行一個(gè)安裝腳本,就能在單張4090顯卡上輕松部署Fin-R1模型。無(wú)論是銀行風(fēng)控還是量化交易,用戶都能快速上手,解決各類金融場(chǎng)景問(wèn)題,真正實(shí)現(xiàn)“一鍵部署”。

場(chǎng)景應(yīng)用

Fin-R1在金融領(lǐng)域展現(xiàn)出多場(chǎng)景適配能力:它能輕松搞定交易系統(tǒng)代碼生成、DCF估值、期權(quán)定價(jià)等復(fù)雜計(jì)算任務(wù),還支持英文金融計(jì)算,助力跨境業(yè)務(wù)分析。在金融安全與合規(guī)方面,F(xiàn)in-R1化身“風(fēng)控衛(wèi)士”實(shí)時(shí)監(jiān)測(cè)交易異常;在智能風(fēng)控領(lǐng)域,它的動(dòng)態(tài)信用評(píng)分模型讓風(fēng)險(xiǎn)評(píng)估更精準(zhǔn)。同時(shí),F(xiàn)in-R1還能協(xié)助生成符合GRI標(biāo)準(zhǔn)的ESG報(bào)告,助力企業(yè)綠色轉(zhuǎn)型。這些場(chǎng)景應(yīng)用均可在GitHub中查看。

定義金融AI新范式,生態(tài)賦能引領(lǐng)未來(lái)

Fin-R1的技術(shù)突破,解決了金融數(shù)據(jù)碎片化、推理邏輯不可控、業(yè)務(wù)泛化能力弱三大金融核心痛點(diǎn)。無(wú)論是金融推理還是合規(guī)審查等業(yè)務(wù)場(chǎng)景,模型均以數(shù)據(jù)驗(yàn)證其性能優(yōu)勢(shì),更通過(guò)可解釋的思維鏈輸出,增強(qiáng)了輸出金融決策的說(shuō)服力。

張立文教授團(tuán)隊(duì)研究領(lǐng)域包括大模型理論及應(yīng)用,金融科技等,專注于大模型語(yǔ)料構(gòu)建、大模型訓(xùn)練、部署、評(píng)測(cè)及智能體應(yīng)用。團(tuán)隊(duì)與互聯(lián)網(wǎng)大廠、金融機(jī)構(gòu)、政府部門等合作,在政府治理、金融、營(yíng)銷等領(lǐng)域提供人工智能與大模型支持。

張立文教授表示,項(xiàng)目組復(fù)現(xiàn)了金融領(lǐng)域首個(gè)推理大語(yǔ)言模型——Fin-R1。Fin-R1對(duì)7B參數(shù)的基座模型進(jìn)行兩階段訓(xùn)練,在金融推理任務(wù)上的能力超過(guò)32B的模型,效果逼近DeepSeek-R1(滿血版)。Fin-R1從訓(xùn)練框架到模型權(quán)重均開源,計(jì)算資源需求量小,個(gè)人電腦即可部署,更加適用于金融場(chǎng)景,并且通過(guò)兩階段訓(xùn)練框架,解決了金融數(shù)據(jù)碎片化和推理邏輯不可控等問(wèn)題,在各大金融基準(zhǔn)測(cè)試中表現(xiàn)卓越,展現(xiàn)出強(qiáng)大的推理能力和業(yè)務(wù)泛化能力,為金融智能化發(fā)展提供有力支持。

財(cái)躍星辰是專注于金融領(lǐng)域的大模型科技公司,由國(guó)內(nèi)領(lǐng)先的財(cái)經(jīng)媒體和金融信息服務(wù)商界面財(cái)聯(lián)社和頭部通用大模型公司階躍星辰聯(lián)合創(chuàng)辦。

財(cái)躍星辰CTO白祚博士表示,本次開源的Fin-R1模型具備優(yōu)秀的產(chǎn)業(yè)價(jià)值。Fin-R1模型以7B小規(guī)模參數(shù),在金融領(lǐng)域展現(xiàn)接近DeepSeek-R1的準(zhǔn)確率。模型在確保金融垂類任務(wù)高準(zhǔn)確性要求下,指數(shù)級(jí)地降低成本,實(shí)現(xiàn)金融普惠。此外,本次開源的“數(shù)據(jù)構(gòu)建-模型訓(xùn)練-性能驗(yàn)證-模型部署-場(chǎng)景應(yīng)用”的全鏈路閉環(huán)具備良好的可復(fù)制性,可快速落地于各類應(yīng)用場(chǎng)景。財(cái)躍星辰正將Fin-R1 應(yīng)用于證券、銀行、保險(xiǎn)、基金等全方位金融場(chǎng)景,并根據(jù)不同場(chǎng)景要求,針對(duì)性地進(jìn)行模型調(diào)優(yōu)升級(jí)。

相關(guān)推薦
免責(zé)聲明
本文所包含的觀點(diǎn)僅代表作者個(gè)人看法,不代表新火種的觀點(diǎn)。在新火種上獲取的所有信息均不應(yīng)被視為投資建議。新火種對(duì)本文可能提及或鏈接的任何項(xiàng)目不表示認(rèn)可。 交易和投資涉及高風(fēng)險(xiǎn),讀者在采取與本文內(nèi)容相關(guān)的任何行動(dòng)之前,請(qǐng)務(wù)必進(jìn)行充分的盡職調(diào)查。最終的決策應(yīng)該基于您自己的獨(dú)立判斷。新火種不對(duì)因依賴本文觀點(diǎn)而產(chǎn)生的任何金錢損失負(fù)任何責(zé)任。

熱門文章