恒生聚源總經理吳震操:“AI時代:從“面向數據計算”轉為“面向計算的數據”|AI領先者心聲?2025
《科創板日報》1月15日訊(記者 黃心怡)ChatGPT橫空出世以來,AI已滲透至經濟、社會與生活的方方面面。剛剛過去的2024年,中外AI及大模型在技術與產業落地上取得了令人矚目的進展。新的2025年,AI必將繼續成為推動各行業變革的關鍵力量。
在2025新年來臨之際,攜手旗下《科創板日報》,推出“AI領先者心聲?2025”新年特別報道。邀請中外人工智能領軍者與行業精英一同回顧過去一年AI領域突破與創新;同時,展望新歲,深入探討AI及其產業應用在未來的機遇與挑戰。
恒生聚源總經理吳震操向《科創板日報》記者表示:
吳震操AI領先者心聲?2025全文如下:
2024年,國內大模型在垂直領域不斷拓展,行業應用逐漸深化。大模型對于公域和私域數據的需求也逐日劇增。然而,傳統信息化系統的數據管理方式已經無法滿足大模型在搜索和推理上的要求。
企業在信息化過程中,通過對現實世界的實體建模,形成實體關系的結構化數據庫。而企業的業務系統則是圍繞著這些數據庫進行建設,通過對于數據庫的操作完成業務流程。在大模型時代到來之后,大量需要NL2SQL等手段讓大模型能夠直接讀取和操作企業內的關系型數據庫。但是大模型在使用關系型數據庫時面臨諸多問題:表的結構設計未攜帶足夠的語義信息,導致大模型無法將“自然語言語義”和“數據庫語義”聯系起來;不同業務系統之間,同類型的數據經常存在格式不一致、單位不統一、數據量綱不對齊等問題,極大地提升了NL2SQL任務的復雜度;當在大模型中輸入數據中維度信息缺失或者錯誤時,無法實現NL2SQL的精確查詢等等;
恒生聚源作為金融行業數智化的先行者,基于過去二十多年積累的全量金融市場數據,創新設計了行業領先的AI應用數據庫“AIDB”。不同于典型的關系型數據庫,它去除了常量表,庫表結構基于“指標、主體、維度“三元組的設計,打破了金融數據應用和消費的技術壁壘,實現”直查“方式訪問金融指標數據,讓數據在大模型應用場景下的獲取與分析更加便捷高效。
目前,AIDB可以提供2000+高質量的核心金融指標數據,涉及權益、債券、基金、指數、財務等業務,可提供時間跨度20年的數據。AIDB作為數據庫基座,一方面支撐起合作方精準的NL2API以及NL2SQL服務,提升大模型對實時金融知識回答的精度與廣度:NL2API應用準確率超過90%,自然語言提問全鏈路端到端準確率超過96%。另一方面,AIDB數據的三元組結構,可以快速轉化為LLM訓練所需的問答對結構高質量訓練樣本,用以支持領域大模型的微調。AIDB與恒生聚源另一款大模型應用產品WarrenQ相結合,實現了真正“語控萬數”的能力。
展望2025年,大模型正在成為企業的知識庫入口,同時AI智能體開始廣泛地與企業的業務系統進行交互,逐漸進化成為企業大腦。這就需要提供與之相匹配的高質量的、可被AI直接消費的業務數據。即圍繞著大模型的推理能力,建立面向AI計算的新型數據庫。數字化建設開始從“面向數據的計算“轉向”面向計算的數據“時代。
- 免責聲明
- 本文所包含的觀點僅代表作者個人看法,不代表新火種的觀點。在新火種上獲取的所有信息均不應被視為投資建議。新火種對本文可能提及或鏈接的任何項目不表示認可。 交易和投資涉及高風險,讀者在采取與本文內容相關的任何行動之前,請務必進行充分的盡職調查。最終的決策應該基于您自己的獨立判斷。新火種不對因依賴本文觀點而產生的任何金錢損失負任何責任。